Kho dữ liệu (data warehouse) cho phép thông tin chi tiết quan trọng và tốc độ thu thập dữ liệu và sự ổn định của kho bãi rất quan trọng đối với hiệu suất của chúng. Tìm hiểu sự khác biệt giữa CDP và Kho dữ liệu (data warehouse) và cách bạn có thể sử dụng cả hai để cải thiện chức năng và thực hiện hành động đối với nghiệp vụ thông minh.
Không gian Nền tảng dữ liệu khách hàng (CDP) đã phát triển đáng kể trong vài năm qua, với nhiều thương hiệu bắt đầu triển khai CDP làm cơ sở hạ tầng nền tảng cho ngăn xếp tăng trưởng của họ.
Tuy nhiên, khi ban đầu tìm hiểu về CDP, một số người có thể thấy mình tự hỏi, “Vấn đề lớn là gì, không phải Kho dữ liệu (data warehouse) của chúng tôi đã làm điều đó rồi sao ?!”
Sự nhầm lẫn nằm ở chỗ cả hai hệ thống đều nhập dữ liệu từ nhiều nguồn và cho phép các bên liên quan trong các nhóm khác nhau truy cập dữ liệu đó. Tuy nhiên, xem xét kỹ hơn cho thấy Kho dữ liệu (data warehouse) và CDP về cơ bản là những công cụ khác nhau và chúng không loại trừ lẫn nhau. Trên thực tế, chúng có thể được sử dụng cùng nhau để mở khóa nhiều Case study .
Kho dữ liệu (data warehouse) là gì?
Theo định nghĩa của Amazon Web Services (AWS), Kho dữ liệu (data warehouse) là một kho lưu trữ thông tin trung tâm có thể được phân tích để đưa ra quyết định sáng suốt hơn. Kho dữ liệu (data warehouse) thu thập dữ liệu đã xử lý từ các hệ thống giao dịch, cơ sở dữ liệu quan hệ và các nguồn khác theo nhịp độ thông thường (thường không theo thời gian thực) và sắp xếp nó thành cơ sở dữ liệu.
Các nhà tiếp thị, quản lý sản phẩm và nhà khoa học dữ liệu sử dụng các ứng dụng như công cụ nghiệp vụ thông minh (BI) và máy khách SQL để truy cập và phân tích dữ liệu trong Kho dữ liệu (data warehouse). Giá trị của Kho dữ liệu (data warehouse) nằm ở khả năng thu thập, sắp xếp và lưu trữ lượng lớn dữ liệu theo cách dễ dàng truy cập vào các báo cáo, bảng chỉ số và truy vấn phân tích của các ứng dụng này.
Lợi ích của việc sử dụng Kho dữ liệu (data warehouse) bao gồm:
- Truy cập tốt hơn vào dữ liệu để ra quyết định sáng suốt
- Dữ liệu tổng hợp từ nhiều nguồn
- Phân tích dữ liệu lịch sử
- Chất lượng dữ liệu, tính nhất quán và độ chính xác
- Tách xử lý phân tích khỏi các hệ thống “ngược dòng” khác, chẳng hạn như hệ thống giao dịch, giúp cải thiện hiệu suất của tất cả các hệ thống
Ví dụ về các Kho dữ liệu (data warehouse) hàng đầu là Amazon Redshift, Snowflake và Google BigQuery.
Kiến trúc Kho dữ liệu (data warehouse) điển hình trông như thế nào?
Kiến trúc Kho dữ liệu (data warehouse) thường được chia thành ba tầng. Tầng trên cùng, dễ tiếp cận nhất là ứng dụng khách front-end trình bày kết quả từ các công cụ BI và máy khách SQL cho người dùng trong toàn doanh nghiệp. Tầng thứ hai, tầng giữa là Máy chủ xử lý phân tích online (OLAP) được sử dụng để truy cập và phân tích dữ liệu. Tầng thứ ba, dưới cùng là máy chủ cơ sở dữ liệu nơi dữ liệu được tải và lưu trữ. Dữ liệu được lưu trữ trong tầng dưới cùng của Kho dữ liệu (data warehouse) được lưu trữ trong bộ nhớ nóng (chẳng hạn như Ổ SSD) hoặc bộ nhớ lạnh (chẳng hạn như Amazon S3) tùy thuộc vào tần suất truy cập dữ liệu.
Nền tảng dữ liệu khách hàng là gì?
Nền tảng dữ liệu khách hàng (CDP) là một cơ sở hạ tầng dữ liệu tập trung thu thập dữ liệu khách hàng của công ty từ nhiều nguồn khác nhau, xác thực dữ liệu đó với một kế hoạch dữ liệu đã được thiết lập, liên kết dữ liệu đó với hồ sơ khách hàng liên tục và kết nối dữ liệu đó với các công cụ và hệ thống được sử dụng để thúc đẩy tăng trưởng.
CDP hỗ trợ Nhà phát triển, Giám đốc sản phẩm và Nhà tiếp thị bằng cách giúp việc thu thập dữ liệu khách hàng trong thời gian thực dễ dàng hơn nhiều, cải thiện chất lượng của dữ liệu đó và đưa dữ liệu đó đến các công cụ và hệ thống bên ngoài, nơi nó có thể được sử dụng để tương tác với khách hàng, phân tích và hơn thế nữa. Với CDP tại chỗ, các nhà phát triển có thể dành ít thời gian hơn để triển khai nhà cung cấp và quản lý mã của bên thứ ba, đồng thời Giám đốc sản phẩm và Nhà tiếp thị có thể truy cập dữ liệu thời gian thực mà họ cần, nơi họ cần.
Các lợi ích của Nền tảng dữ liệu khách hàng bao gồm:
- Tăng quyền truy cập vào dữ liệu khách hàng theo thời gian thực cho các bên liên quan phi kỹ thuật
- Cải thiện chất lượng dữ liệu khách hàng thông qua các công cụ và hệ thống đang được sử dụng để thúc đẩy tăng trưởng
- Đơn giản hóa các quy trình quản trị dữ liệu và tăng cường bảo mật dữ liệu
- Kích hoạt dữ liệu nhanh hơn để cá nhân hóa dựa trên dữ liệu tốt hơn trên các kênh
- Ít giờ kỹ thuật hơn dành cho việc triển khai nhà cung cấp và quản lý mã của bên thứ ba
Một kiến trúc CDP điển hình trông như thế nào?
CDP thu thập dữ liệu khách hàng cấp độ cá nhân của bên thứ nhất từ khắp các điểm tiếp xúc và máy chủ kỹ thuật số của doanh nghiệp bạn (ứng dụng dành cho thiết bị di động, trang web, nguồn cấp dữ liệu OTT, S2S, v.v.) thông qua kết nối API và/hoặc triển khai SDK. Dữ liệu này sau đó được xử lý và tiêu chuẩn hóa (chuyển đổi, làm giàu, xác nhận) để dễ dàng tích hợp với các công cụ và hệ thống bên ngoài.
Khi dữ liệu được thu thập, chế độ xem thời gian thực của dữ liệu đến có sẵn trong giao diện người dùng để người dùng trong tổ chức của bạn có thể giám sát hoạt động. Dữ liệu khách hàng sau đó được lưu trữ lâu dài trong các Kho dữ liệu (data warehouse) khác nhau tùy thuộc vào loại dữ liệu và mục đích dự định. Các chức năng như tra cứu hồ sơ, quản lý chất lượng dữ liệu, phân đoạn đối tượng và kết nối dữ liệu có sẵn trong giao diện người dùng của CDP, cho phép người dùng kích hoạt dữ liệu khách hàng.
- do nhà tiếp thị quản lý;
- cơ sở dữ liệu thống nhất, liên tục, duy nhất cho hành vi, hồ sơ và dữ liệu khác của khách hàng, từ bất kỳ nguồn nội bộ hoặc bên ngoài nào;
- giá trị nhận dạng nhất quán liên kết tất cả dữ liệu của khách hàng;
- có thể truy cập bởi các hệ thống bên ngoài và được cấu trúc để hỗ trợ nhu cầu của các nhà tiếp thị về quản lý chiến dịch, phân tích tiếp thị và kinh doanh thông minh; [4]
- cung cấp cái nhìn 360 độ về khách hàng; và
- cho phép người dùng có khả năng dự đoán động thái tiếp theo tối ưu với khách hàng. [5]
CDP có thể được sử dụng với Kho dữ liệu (data warehouse) của bạn như thế nào?
CDP và Kho dữ liệu (data warehouse) không loại trừ lẫn nhau. Trong khi Kho dữ liệu (data warehouse) cung cấp một hệ thống để lưu trữ và phân tích dữ liệu dài hạn, CDP cung cấp cơ sở hạ tầng để kết nối dữ liệu thời gian thực.
Vận chuyển dữ liệu sạch sẽ và nhất quán đến Kho dữ liệu (data warehouse) của bạn
Chất lượng dữ liệu là lợi ích chính của CDP. Bằng cách cung cấp một API duy nhất để thu thập dữ liệu từ tất cả các điểm tiếp xúc của khách hàng, cũng như các công cụ lập kế hoạch dữ liệu để đảm bảo rằng chỉ dữ liệu chất lượng và nhất quán mới đi vào hệ thống của bạn, CDP có thể hoạt động như một lớp xác thực trước khi dữ liệu vào Kho dữ liệu (data warehouse) của bạn.
Dưới đây là sơ đồ kiến trúc dữ liệu kết nối CDP và Kho dữ liệu (data warehouse) và chi tiết các Case study được hỗ trợ trong mỗi hệ thống.
Tích hợp trực tiếp nâng cao giá trị Kho dữ liệu (data warehouse) của bạn
CDP cung cấp cho bạn khả năng xuất dữ liệu tự động, lọc và tuân thủ nâng cao cũng như phát lại dữ liệu để lưu Kho dữ liệu (data warehouse) nhanh hơn và ổn định hơn. Ví dụ: mParticle cho phép bạn chuyển tiếp dữ liệu khách hàng đến và tải dữ liệu lịch sử vào Kho dữ liệu (data warehouse) như Snowflake, Amazon Redshift và Google BigQuery thông qua các tích hợp được đóng gói.
Ngoài ra, tích hợp Kafka của mParticle cho phép bạn truyền dữ liệu khách hàng đến các hệ thống và ứng dụng hỗ trợ Kafka với tính năng chuyển tiếp dữ liệu sự kiện, lọc và tuân thủ nâng cao, thông báo sự kiện phân tán và tìm nguồn cung ứng sự kiện. mParticle cũng có thể đăng ký dữ liệu sự kiện theo thời gian thực bằng Kafka Feed. Sau khi các sự kiện được thu thập vào mParticle từ Kafka, chúng có thể được sử dụng để hỗ trợ các sáng kiến tiếp thị và sản phẩm.
CDP đẩy nhanh thời gian đến giá trị của thông tin chuyên sâu BI
Nếu bạn đang sử dụng công cụ BI để truy cập và phân tích dữ liệu trong Kho dữ liệu (data warehouse) của mình, nhiều CDP sẽ cho phép bạn xuất dữ liệu truy vấn từ các công cụ BI vào CDP của bạn thông qua tích hợp nguồn cấp dữ liệu đám mây. Khi dữ liệu này đã được nhập vào CDP của bạn, nó có thể được sử dụng để hỗ trợ các sáng kiến tiếp thị và sản phẩm. Ví dụ: tích hợp Nguồn cấp dữ liệu của mParticle cho phép bạn gửi kết quả từ Kho dữ liệu (data warehouse) của mình đến mParticle, nơi chúng được lưu trữ dưới dạng thuộc tính người dùng và các nhóm tiếp thị có thể sử dụng để tăng cường phân khúc đối tượng, thuộc tính được tính toán, lọc dữ liệu, v.v.
Vai trò của CDP là gì khi Kho dữ liệu (data warehouse) của bạn là nguồn sự thật của bạn?
Trong các tổ chức mà Kho dữ liệu (data warehouse) đóng vai trò là trung tâm của hệ sinh thái dữ liệu, CDP vẫn có thể tăng thêm giá trị đáng kể:
Các bên liên quan phi kỹ thuật ít phụ thuộc vào kỹ sư hơn
Khi dữ liệu chỉ có sẵn trong Kho dữ liệu (data warehouse), các nhóm phi kỹ thuật phải dựa nhiều vào các kỹ sư dữ liệu để truy vấn, lọc và chuyển tiếp thông tin này để phục vụ các Case study của họ. Tuy nhiên, khi các nhóm tăng trưởng có quyền truy cập vào CDP, các bên liên quan đến tiếp thị và sản phẩm có thể tự xử lý nhiều chức năng trong số này trong giao diện của công cụ. Điều này không chỉ cho phép các nhóm tăng trưởng nhận ra giá trị của các công cụ kích hoạt hạ nguồn một cách nhanh chóng và độc lập mà còn giải phóng các nhà phát triển khỏi việc phải liên tục gửi dữ liệu đến các nhóm phi kỹ thuật, cho phép họ tập trung vào công việc có tác động kỹ thuật hơn.
Ví dụ: các nhóm tiếp thị thường có nhu cầu định kỳ đối với các phân khúc đối tượng chi tiết để thúc đẩy các Case study cá nhân hóa. Khi các nhóm sử dụng Kho dữ liệu (data warehouse) làm nguồn sự thật cho dữ liệu khách hàng của họ, các nhóm kỹ thuật sẽ được giao nhiệm vụ viết các truy vấn SQL để truy xuất các tập dữ liệu. Ngay cả với lợi ích của một công cụ trong ngăn xếp dữ liệu như công cụ ETL ngược, giúp di chuyển dữ liệu ra khỏi Kho dữ liệu (data warehouse) và vào hệ thống kích hoạt, các kỹ sư vẫn thường cần phải viết các truy vấn đặc biệt cho các trường hợp tiếp thị dịch vụ và sử dụng sản phẩm. Tuy nhiên, bằng cách sử dụng CDP như mParticle, chi phí kỹ thuật này được trừu tượng hóa và người dùng không chuyên về kỹ thuật có thể xây dựng và vận chuyển đối tượng trực tiếp trong một giao diện người dùng đơn giản.
Tích hợp plug-and-play cho thời gian nhanh chóng đến giá trị
Không giống như Kho dữ liệu (data warehouse), CDP cung cấp tích hợp trực tiếp với một hệ sinh thái rộng lớn gồm các công cụ tốt nhất trong lớp để tiếp thị, phân tích, quảng cáo, dịch vụ khách hàng và các chức năng khác. Mặc dù có thể chuyển tiếp dữ liệu đến các công cụ này từ Kho dữ liệu (data warehouse), nhưng điều này thường có thể yêu cầu các kỹ sư dữ liệu xây dựng một đường ống đầu ra riêng để kết nối các công cụ này. Sử dụng CDP, các nhóm tăng trưởng có thể sử dụng một giao diện đơn giản để thêm và xóa các hệ thống hạ nguồn và kiểm soát luồng dữ liệu đến các công cụ này một cách dễ dàng tương tự. Điều này giúp các nhà tiếp thị và quản lý sản phẩm dễ dàng thực hiện các Case study kích hoạt hơn nhiều, cũng như giới thiệu các nhà cung cấp mới với sự tham gia kỹ thuật tối thiểu.
Một giải pháp tốt hơn cho quyền riêng tư và tuân thủ dữ liệu
Bất cứ khi nào các kỹ sư dữ liệu viết các truy vấn SQL để xây dựng đối tượng, trách nhiệm lọc các tín hiệu quyền riêng tư cũng thuộc về các kỹ sư này và điều này chuyển hướng thời gian và nguồn lực kỹ thuật ra khỏi các mục tiêu kỹ thuật cốt lõi. Tuy nhiên, khi sử dụng CDP với các tính năng Quản trị Dữ liệu tích hợp, cơ sở hợp pháp để xử lý dữ liệu cá nhân (sự đồng ý), cộng với mục đích có thể được xác định bởi nhân viên tuân thủ, quyền riêng tư hoặc bảo vệ dữ liệu.
Để tìm hiểu thêm về cách mParticle giúp kết nối dữ liệu khách hàng của bạn với các công cụ và hệ thống bạn đang sử dụng để thúc đẩy tăng trưởng, bao gồm cả Kho dữ liệu (data warehouse) của bạn, bạn có thể khám phá tài liệu của chúng tôi tại đây.