Nếu bạn nào theo dõi mục Blog của BigDataUni từ trước đến nay, chắc cũng biết BigDataUni thường cung cấp nhiều bài viết về ứng dụng của Data analytics, Data mining hay Big Data trong nhiều ngành và lĩnh vực khác nhau từ tài chính, ngân hàng, bán lẻ hay E-commerce, cho đến Social media marketing và gần nhất là lĩnh vực năng lượng, tiện ích (ngành điện). Tiếp tục với chủ đề khác, lần này chúng ta sẽ tìm hiểu ứng dụng của khai thác, phân tích dữ liệu trong ngành giải trí truyền thông (Media & Entertainment – M&E), bài viết phần 1 tập trung trước tiên ở mục đích tăng trải nghiệm khách hàng theo hướng cá nhân hóa với một số ví dụ.
Nếu phải chỉ ra một ngành công nghiệp phát triển mạnh nhất thì có lẻ M&E luôn đứng trong top đầu, và là một trong những ngành mang lại lợi nhuận tăng trưởng cao nhất cho các công ty. Tất cả nhờ vào những cải tiến mạnh mẽ của nền tảng khoa học công nghệ, kỹ thuật và nhu cầu người dùng ngày càng cao về chất lượng của các sản phẩm dịch vụ mà cụ thể là nội dung của những chương trình giải trí, các thể loại phim,… Vì thế nhiều ông lớn trong ngành M&E nổi trội nhất ví dụ Netflix càng có nhiều động lực trong việc đẩy mạnh ứng dụng công nghệ và đặc biệt là tận dụng dữ liệu làm “nguồn tài sản” để nâng cao hiệu quả hoạt động ở mọi khía cạnh.
Nhu cầu ứng dụng khai thác dữ liệu trong ngành M&E
Ngành giải trí truyền thông là ngành công nghiệp đa dạng bao gồm nhiều phân khúc như các công ty sản xuất film chiếu rạp, phim truyền hình, các công ty giải trí truyền hình, các công ty âm nhạc, các công ty sản xuất game, các công ty truyền thông nói chung, các báo điện tử, các công ty quảng cáo trực tuyến, và những loại hình giải trí trực tuyến khác,…Theo báo cáo của PwC “Global Entertainment & Media Outlook 2019–2023” tổng doanh thu của ngành M&E trên toàn cầu là 2.1 nghìn tỷ USD trong năm 2018, ước tính là 2.2 nghìn tỷ năm 2019, dự báo đến năm 2023 là 2.6 nghìn tỷ USD, với tỷ lệ tăng trưởng kép CAGR là 4.3% từ năm 2018-2023 (số liệu cập nhật 6/2019 và chưa tính đến tác động Covid-19 năm nay, báo cáo 2020 sẽ công bố vào tháng 9)
Mặc dù dự báo có sự tăng trưởng, nhưng nhiều tổ chức lo ngại về việc doanh thu sụt giảm ở các phân khúc thị trường truyền thống. Các chuyên gia PwC còn cho rằng trải nghiệm người dùng phải được ưu tiên hơn và AI là một trong những công nghệ mới hàng đầu, sẽ là công cụ hữu ích giúp các công ty M&E đáp ứng tốt hơn nhu cầu của người dùng.
Ngành giải trí truyền thông đang có sự thay đổi lớn trong cách thức kinh doanh. Trong nhiều năm trước đây, các công ty thường cung cấp những nội dung giải trí đến người đọc, người nghe, khán giả xem truyền hình mà họ nghĩ là phù hợp tại một thời điểm, hay khoảng thời gian cụ thể ví dụ các bạn có lẽ cũng biết mọi phim truyện được chiếu trên những kênh truyền hình TV đâu hề được lựa chọn bởi người xem, các bạn sẽ so sánh giữa các phim, phim nào hay thì sẽ tiếp tục theo dõi và ngược lại chứ không hề được kiến nghị đến các nhà đài, và dĩ nhiên chắc chắn họ không thể đáp ứng hàng triệu triệu khán giả của mình. Hơn nữa, các nhà đài muốn “sống sót” thì họ phải phụ thuộc hoàn toàn vào đội ngũ biên tập, và họ chỉ có thể phân tích dữ liệu xem lịch sử (chưa hẳn gọi là Big data nếu tổ chức chưa phát triển hệ thống thu thập, phân tích dữ liệu lớn hoặc không có nguồn dữ liệu dồi dào, không có cách tiếp cận lượng dữ liệu lớn, đa dạng hoặc dữ liệu phân tích còn đơn giản) để tìm xem nội dung giải trí mà người xem có thể quan tâm nhất, và họ cũng sẽ là người quyết định phát triển nội dung nào mà họ nghĩ là đúng nhất với mong muốn của người xem. Ví dụ sẽ có những kênh chỉ chiếu phim Việt thay vì chiếu phim nước ngoài nếu nhận thấy rating (hiệu suất nguời xem, tỷ lệ người xem trung bình dành cho 1 phim, 1 show giải trí,… tại 1 thời điểm cụ thể so với các phim, show giải trí ở các kênh khác) cao hơn đối với dòng phim Việt tức khán giả của kênh này thích xem phim Việt của kênh hơn là kênh nước ngoài, tương tự sẽ là phim hành động, hay phim tình cảm. Nếu đội ngũ biên tập không có sự sáng tạo, rập khuôn, không linh hoạt phát triển nội dung thì các nhà đài “sẽ đi tong”. Truyền hình TV với vị thế của mình sẽ dần đi xuống khi không thể linh hoạt đáp ứng chính xác và chủ động hơn mong muốn của người xem và kể từ khi một nền tảng mới, một hình thức truyền hình mới, một cách thức giải trí mới ra đời đó là phim trực tuyền, kênh giải trí trực tuyến.
Ngoài ra, việc phân tích dữ liệu xem lịch sử các kênh truyền hình hầu hết chỉ đứng trên góc nhìn tỷ lệ lượt xem mà có thể không quan tâm đến các yếu tố tác động ví dụ những bộ phim Việt nổi tiếng gần đây như “Người Phán xử”, “Quỳnh búp bê”, “Sống chung với mẹ chồng”, “Về nhà đi con”, “Tình yêu và tham vọng”, “Gạo nếp gạo tẻ”,… ngoài yếu tố nội dung hay, hấp dẫn, thu hút người xem thì có lý do nào khác khiến những bộ phim này đứng top? Nếu tìm ra được thì có lẽ các bộ phim sau này cũng có khả năng đạt được các thành tựu tương tự. Triển khai thu thập dữ liệu từ các kênh social media để phân tích feedback của người xem, hay phân tích dữ liệu từ các hoạt động quảng cáo, marketing cho phim,… là một số cách có thể thực hiện để tìm hiểu một bộ phim rating cao ngoài nội dung hay thì cần những gì.
Nhận thấy được tầm quan trọng tại sao cần quan tâm đến nhu cầu của người xem, các công ty, tổ chức đã và đang tận dụng nguồn dữ liệu của mình. Từ đó dẫn đến xu hướng đang diễn ra ngày càng mạnh không chỉ ở các chương trình quảng cáo, các show giải trí truyền hình, phim truyện truyền hình, phim lẻ, phim chiếu rạp trong việc xác định, cung cấp nội dung đến khách hàng nào, là ai, khi nào, qua hình thức nào là tối ưu nhất để thay đổi so với những cách thức truyền thống đã không còn phù hợp ở thời đại ngày nay. Ý tưởng cũng đóng vai trò cốt lõi. Tìm thấy những ý tưởng tốt để phát triển những nội dung giải trí mới, loại hình giải trí mới trong tương lai, kết hợp với sở thích, mong muốn người xem luôn là mục tiêu hàng đầu hiện nay của các công ty giải trí truyền thông.
Hay nói cách khác, Personalization – Cá nhân hóa trong việc cung cấp sản phẩm, dịch vụ giải trí đến khách hàng là “kim chỉ nam” của ngành M&E thời điểm hiện tại – các công ty phải chuyển mình, phải thay đổi, tận dụng nguồn dữ liệu để cung cấp sản phẩm, dịch vụ giải trí hướng đến không phải là “hàng triệu người xem” (millions of audiences) mà là “hàng triệu cá nhân” (millions of individuals).
Điểm yếu khác của các công ty giải trí truyền thống bên cạnh không xác định được nội dung giải trí cụ thể phù hợp với từng khách hàng theo cá nhân hóa, mà còn không kiểm soát được những sản phẩm, dịch vụ của mình có thể đến với khách hàng bằng các cách nào, bằng những kênh nào.
Phân tích dữ liệu từ nhiều nguồn khác nhau đặc biệt là ở các nền tảng giải trí trực tuyến, social media là cực kỳ cần thiết khi xu hướng con người sử dụng các thiết bị điện tử thông minh cụ thể như smartphone, tablet, cho đến độ phổ biến trong sử dụng internet, mạng wifi, 3G đến 5G,… để có cho mình những giây phút giải trí thư giãn, đang tăng mạnh hơn bao giờ hết. Nền tảng trực tuyến đang được mọi công ty ngành M&E quan tâm và khai thác. Chính vì điều này, cơ hội ngày càng nhiều để họ có thể tiếp cận nhiều nguồn dữ liệu khách hàng từ các trang mạng xã hội, nhiều kênh truyền thông, giải trí khác. Đặc biệt khi người dùng hiện nay mong muốn tiếp cận những nội dung giải trí mọi lúc, mọi nơi, bằng mọi thiết bị, dữ liệu hành vi mà người dùng để lại sẽ rất nhiều và mang lại nhiều thông tin hữu ích khi được khai thác hợp lý.
Tuy đây cũng sẽ là thách thức lớn đòi hỏi các công ty ngành M&E phải đưa ra nhiều hơn các dịch vụ, sản phẩm giải trí kỹ thuật số với công nghệ hiện đại, cung cấp theo hình thức đa kênh, linh hoạt, nhưng phải dựa trên sở thích và mong muốn, thói quen của khách hàng để sáng tạo nội dung giải trí.
Tỷ lệ doanh thu đến từ các sản phẩm, dịch vụ giải trí nền tảng kỹ thuật số của các công ty M&E trên toàn cầu tăng mạnh từ năm 2014 đến 2018, và dự báo tiếp tục tăng bền vững từ 2019 đến 2023. Số liệu phản ánh xu hướng các công ty ứng dụng công nghệ trong thiết kế những sản phẩm, dịch vụ giải trí mới và nhu cầu của người xem, người đọc và người dùng mong muốn tiếp cận nhiều hơn với các sản phẩm, dịch vụ có tích hợp công nghệ tiên tiến hàng đầu, ví dụ nhiều năm trước đây, cụ thể năm 2008, 2009 chúng ta từng có cơn sốt phim 3D, những năm sau đó, có phim 4D và hiện tại là các công nghệ thực tế ảo VR (Virtual reality), virtual tour và tương tác thực tế ảo AR (Augmented reality).
Khi các tổ chức thực sự tham gia vào cuộc chiến khốc liệt của lĩnh vực giải trí trên các nền tảng mới như nền tảng trực tuyến, phân tích dữ liệu lúc này đóng vai trò cực kỳ quan trọng, tạo ra lợi thế kinh doanh vô cùng to lớn. Từ những hành vi nhỏ nhất của khách hàng bao gồm lướt web, lướt mạng xã hội, tìm kiếm nội dung giải trí mình cần, cho đến like, share, để lại bình luận, phản hồi,… thông qua các ứng dụng của phân tích dữ liệu sẽ được chuyển thành những insights có giá trị (xu hướng giải trí, sở thích, số tiền bỏ ra, hình thức giải trí,..), hỗ trợ mang lại nhiều trải nghiệm tốt hơn cho khách hàng một cách nhanh chóng, kịp thời. Dữ liệu chắc chắn sẽ là nguồn tài sản quý giá hơn bao giờ hết đối với các công ty ngành M&E.
Không chỉ cải thiện trải nghiệm mang tính cá nhân hóa cho khách hàng, dữ liệu có thể còn giúp các công ty M&E tối ưu hoạt động kinh doanh, giảm chi phí, tăng hiệu suất, năng suất của những quy trình, hệ thống vận hành. Chúng ta sẽ tìm hiểu phần ứng dụng để thấy rõ hơn ngay ở phần 2
Mặc dù thấy được lợi ích và cơ hội trong khai thác, phân tích dữ liệu mang lại giá trị kinh doanh là như thế nào nhưng các tổ chức vẫn phải đối mặt với vô vàn thách thức, và những thách thức này không chỉ dừng lại ở việc xác định, thu thập dữ liệu từ nhiều nơi khác nhau mà làm sao có thể mở rộng, xây dựng một hệ thống tích hợp các nguồn dữ liệu với nhau, xử lý, khai thác, phân tích chúng để có được thông tin hữu ích, “insights” hỗ trợ ra quyết định, hành động nhanh chóng và hiệu quả, mục đích khác là không bị đối thủ cạnh tranh bỏ lại quá xa. Đặc biệt giống như các công ty thuộc ngành, lĩnh vực khác, khi chuyển đổi sang “định hướng dữ liệu” – Data – driven, đòi hỏi thay đổi cả cách thức quản lý, văn hóa, cũng như các quy trình làm việc. Hơn nữa khả năng tiếp cận, đưa vào sử dụng những nền tảng công nghệ mới, thiết lập nhiều kênh phân phối, kênh truyền thông kết nối tốt hơn với khách hàng là không phải dễ dàng. Thời gian, nguồn nhân lực, nguồn tài chính là những yếu tố cần xem xét trước tiên.
Bài viết lần này, trọng tâm là giới thiệu những ứng dụng của phân tích dữ liệu đối với ngành giải trí truyền thông nên chúng tôi sẽ không trình bày các thách thức mà những công ty trong ngành có thể đối mặt. Các bạn có thể tham khảo thêm ở những tài liệu khác.
Tóm lại, những ông lớn hàng đầu trong ngành M&E như Netflix, Amazon, và Disney,… đã cho thấy họ thành công như thế nào trong việc tiên phong nâng cao trải nghiệm của khách hàng thông qua sử dụng phân tích dữ liệu cũng đủ để chứng minh tầm quan trọng của dữ liệu, khai thác chúng hiệu quả là như thế nào, không có gì cần bàn cãi thêm.
Chúng ta cùng đi vào phần trọng tâm của bài viết.
Ứng dụng của phân tích dữ liệu trong ngành M&E
Ở góc độ tổng quát, các công ty ngành giải trí truyền thông tận dụng nguồn tài sản dữ liệu của mình với các mục đích điển hình như:
- Xác định hay dự báo nhu cầu của khán giả, người xem, người đọc: phân tích dữ liệu để tìm hiểu nội dung giải trí, show truyền hình, loại phim nào, loại nhạc nào, thể game gì,… mà người dùng có thể thích nhất. Dữ liệu có thể là lịch sử xem, lịch sử tìm kiếm, đánh giá, xếp hạng, phản hồi từ các kênh social media, dữ liệu vị trí, nhân khẩu học,…
- Tối ưu thời điểm cung cấp nội dung giải trí: sử dụng thông tin chi tiết từ kết quả phân tích xu hướng, các công ty truyền thông và giải trí có thể hiểu khi nào khách hàng có thể xem nội dung nhiều nhất và họ sẽ sử dụng thiết bị nào khi họ xem.
- Quảng cáo nhắm mục tiêu: phân tích dữ liệu cho phép các công ty hiểu được hành vi, sở thích và nhu cầu giải trí và phương tiện kỹ thuật số có thể khách hàng sử dụng cùng với dữ liệu nhân khẩu học để cung cấp các quảng cáo được cá nhân hóa đến đúng đối tượng khách hàng, đúng ngữ cảnh, vào đúng thời điểm và đúng kênh. Phân tích dữ liệu giúp cải thiện target marketing trong bối cảnh hành vi khách hàng ngày càng phức tạp. Các công ty truyền thông và giải trí có thể tăng tỷ lệ chuyển đổi bằng cách xác định các phân khúc khách hàng.
- Tăng tỷ lệ giữ chân khách hàng, thu hút khách hàng mới: thông qua phân tích dữ liệu từ nhiều nguồn khác nhau đặc biệt là các phản hồi trên chính các kênh trực tuyến, các kênh social media, các công ty M&E sẽ hiểu lý do tại sao khán giả không còn theo dõi các kênh truyền thông của mình, không tiếp tục subscribe, không follow, không trải nghiệm các nội dung giải trí mới,… từ đó các công ty truyền thông và giải trí có thể phát triển các chiến lược quảng cáo và sản phẩm tốt nhất để thu hút và giữ chân khách hàng.
- Cải thiện nội dung giải trí có giá trị, các loại hình, sản phẩm giải trí mới: phân tích dữ liệu có thể giúp các công ty truyền thông và giải trí tìm thấy những ý tưởng, những xu hướng, để sáng tạo nội dung giải trí mới, phát triển các loại hình giải trí mới thu hút nhiều người xem hơn.
Cá nhân hóa trong sản phẩm, dịch vụ ngành M&E
Giống như bất kỳ ở các ngành và lĩnh vực khác, để tìm hiểu về khách hàng, mỗi tổ chức phải xây dựng các hồ sơ khách hàng ở mọi khía cạnh từ nhân khẩu học, đến sở thích, hành vi, theo một góc 360 độ, một cách chi tiết. Tuy nhiên, để làm được điều này cần khối lượng lớn dữ liệu từ nhiều nguồn khác nhau ví dụ dữ liệu mà người xem, người đọc để lại ở mỗi điểm tiếp xúc với các kênh truyền thông, kênh bán hàng, kênh cung cấp nội dung giải trí của các công ty M&E. Phân tích chúng để xác định thói quen giải trí của khách hàng, cách họ giải trí, họ quan tâm đến loại hình giải trí gì, vấn đề hay chủ đề họ thường theo dõi. Từ đó sẽ hiểu khách hàng rõ hơn, tinh chỉnh cách thức bán hàng, cách thức marketing (target marketing – marketing nhắm mục tiêu), phát triển sản phẩm, dịch vụ giải trí phù hợp theo nhu cầu của từng nhóm hay phân khúc khách hàng cụ thể, tạo điều kiện để giữ chân khách hàng, thu hút khách hàng mới, tăng trải nghiệm của khách hàng, tăng doanh thu dựa vào cơ hội cross-sell hay up-sell sản phẩm.
Netflix là công ty giải trí, nền tảng phim trực tuyến hàng đầu thế giới với nền tảng công nghệ tiên tiến, đã xây dựng một “đế chế” cho riêng mình xoay quanh cốt lõi là dữ liệu hành vi khách hàng và phân tích dữ liệu để tăng trải nghiệm cá nhân hóa của khách hàng.
Như Todd Yellin, VP of Product Innovation của Netflix cho rằng: “Đối với các công ty ngày nay, họ không quan tâm liệu bạn là một bà lão 60 tuổi hay là một thanh niên 20 tuổi. Vì cậu thanh niên 20 tuổi có thể xem bộ phim “Say yes to the dress” còn bà lão 60 tuổi có thể xem “Hell boy”.” Mọi phán đoán về khách hàng nếu chỉ dựa trên dữ liệu nhân khẩu học là không đủ, và phải đặc biệt chú ý vào dữ liệu hành vi khách hàng, để thấu hiểu khách hàng nào là mục tiêu nhắm đến, để khám phá ra được hành trình trải nghiệm của khách hàng (Customer journey map) như chúng tôi đề cập bài viết trước.
Netflix biết rằng chìa khóa để hiểu khách hàng tập trung chủ yếu trong những dữ liệu hành vi khách hàng; qua việc phân tích để tìm hiểu “Customer insights” có thể vẽ nên một bức tranh chính xác hơn về những gì khách hàng mong nuốn nhất, cách thức và thời điểm thích hợp để họ cung cấp các dịch vụ, sản phẩm tốt nhất, phù hợp nhất đến khách hàng.
Sử dụng thông tin về hành vi khách hàng để cung cấp đến họ những sản phẩm, dịch vụ mang tính cá nhân hóa chính là mục đích mà Netflix luôn hướng đến, ví dụ điển hình nhất là hệ thống khuyến nghị (recommendation engines), thông qua hệ thống này, dữ liệu hành vi khách hàng sẽ được phân tích sau đó tự động tìm kiếm sản phẩm, dịch vụ phù hợp nhất với nhu cầu khách hàng (như một cách thức dự báo hành vi mua hàng của khách hàng trong tương lai).
Ví dụ Netflix giới thiệu những bộ phim có nội dung gần giống với bộ phim gần nhất mà bạn xem, họ cho rằng chúng sẽ phù hợp với sở thích, loại phim bạn thường thích xem. Như trên hình bạn sẽ thấy dòng chữ “More like…” bên trên những bộ phim được gợi ý. Nếu thực sự những bộ phim này đúng với nhu cầu của người xem, thì hiệu quả kinh doanh của Netflix các bạn nghĩ xem sẽ tăng lên như thế nào.
+ 75% hoạt động của người xem trên Netflix được thúc đẩy bởi hệ thống khuyến nghị (Nguồn)
+ Hệ thống khuyến nghị của Netflix, tiết kiệm cho công ty khoảng 1 tỷ đô la mỗi năm thông qua việc giảm tỷ lệ khách hàng rời dịch vụ (Nguồn)
Hình trên là giao diện cũ của Netflix, và recommendation system trong hình là hệ thống khuyến nghị đầu tiên khi Netflix mới đưa vào sử dụng. Hệ thống khuyến nghị của Netflix giờ đây đã được cải tiến hơn trước khá nhiều, các bạn nếu có “điều kiện” có thể tự mình trải nghiệm trên website của Netflix.
Để phát triển những dịch vụ cá nhân hóa cho người xem, Netflix đã sử dụng các công cụ như:
- A/B testing: theo Todd Yellin, Netflix chạy hơn 250 A/B test mỗi năm, mỗi bài test kiểm tra 2 phiên bản trải nghiệm khác nhau để xác định người xem tương tác, phản ứng lại như thế nào với những thay đổi trong cung cấp các trải nghiệm. Trung bình mỗi lần, Netflix sẽ test gần 10000 người dùng. Ví dụ A/B testing giúp Netflix tối ưu các thẻ hình ảnh quảng cáo film, hay video teaser của phim trên hệ thống khuyến nghị của mình để hiển thị theo đúng nhu cầu và tâm lý của khách hàng từ đó tăng trải nghiệm khách hàng một cách hiệu quả hơn. Các bạn xem qua các image nhỏ là posters của bộ phim nổi tiếng “Stranger things” sẽ thấy sự khác nhau dựa theo tâm lý của từng khách hàng. Ví dụ nếu bạn thích sự ma mị thì có lẽ sẽ thích poster thứ 1, ngoài cùng bên trái, nếu bạn thích các bộ phim năng động, tuổi teen có thể thích poster thứ 3, dòng thứ 2.
- AI: tương tự như Amazon, Netflix khai thác tối đa nền tảng công nghệ AI, và Machine learning để học về sở thích, nhu cầu thực sự của người xem, sử dụng dữ liệu xem lịch sử, sử dụng dữ liệu tra cứu, dữ liệu xếp hạng phim của người xem để phân tích, dự báo bộ phim nào với chủ đề nào cần giới thiệu đến họ, không những cá nhân hóa trải nghiệm mà còn giúp giữ chân người xem lâu hơn, thúc đẩy họ quay lại tìm kiếm bộ phim có thể mình sẽ thích.
- Phân tích dữ liệu theo thời gian thực, cung cấp trải nghiệm cá nhân hóa kịp thời và nhanh chóng nhất: bên cạnh các thuật toán sử dụng để phân tích dữ liệu, Netflix sử dụng chính hành vi của người xem khi họ nhận được các gợi ý từ hệ thống khuyến nghị (thích hay không thích) để nhanh chóng điều chỉnh, giới thiệu bộ phim phù hợp. Ví dụ nếu bạn chìm sâu vào những bộ phim hành động, Netflix sẽ giới thiệu thêm các bộ phim hành động khác để giữ chân bạn. Giải pháp này hiệu quả hơn việc chỉ dựa vào dữ liệu lịch sử tìm kiếm ví dụ có thể khách hàng tìm một bộ phim hài do tò mò, do nghe nói bộ phim này nổi tiếng như thực sự họ thích xem phim hành động hơn.
- Netflix sử dụng chính thời gian xem của người dùng để giới thiệu phim, ví dụ vào buổi tối, hay vào đêm khuya, khá muộn, Netflix sẽ giới thiệu bạn đến các bộ phim ngắn, các chương trình thời lượng ngắn chứ không kéo dài vì dự báo có thể bạn sẽ buồn ngủ và bỏ dở giữa chừng!
Ngoài Netflix, thì Spotify – dịch vụ nghe nhạc kỹ thuật số trực tuyến số 1 thế giới – sử dụng nền tảng phân tích Big data để thu thập dữ liệu từ hơn 60 triệu người nghe nhạc trên toàn thế giới, Spotify sau đó phân tích dữ liệu cá nhân, playlist của từng người nghe, và những dữ liệu hành vi, dữ liệu lịch sử khác để đưa ra các đề xuất có liên quan, cá nhân và phụ hợp với sở thích nghe nhạc cho từng người nghe những sản phẩm âm nhạc có thể họ sẽ ưa chuộng, những nghệ sĩ có thể có phong cách âm nhạc hấp dẫn họ.
Hàng tuần, Spotify sẽ thiết lập một playlist mới cho từng người dùng, playlist bao gồm 30 bài hát mà họ sẽ muốn lắng nghe, dựa trên dữ liệu cá nhân về sở thích, thói quen nghe nhạc và dữ liệu về các nghệ sĩ, cũng như phong cách âm nhạc của họ, nhạc cụ họ dùng, nhịp điệu, sau cùng là dữ liệu thô của các bài hát (âm tiết, giai điệu, nốt nhạc,…) để tìm thấy sự kết hợp hoàn hảo, hỗ trợ đưa ra những đề xuất tốt hơn cho người nghe. Bên cạnh cá nhân hóa trong cung cấp dịch vụ, Spotify còn có thể đưa ra nhiều dự báo đối với những sản phẩm âm nhạc chẳng hạn như dự báo giải thưởng Grammy. Theo Havard Business School – Digital Initiative thì Spotify phát triển dịch vụ “Discover weekly” của mình Spotify kết hợp hệ thống khuyến nghị dựa trên 3 công cụ thuật toán
- Collaborative Filtering (CF): các mô hình phân tích hành vi của người nghe nhạc so sánh với các hành vi những người nghe nhạc khác
- Natural Language Processing (NLP): phân tích các dữ liệu văn bản liên quan
- Audio: những mô hình phân tích các tệp âm thanh
Công nghệ phân loại tự động, hiện đang được Spotify sử dụng rất thành công, khai thác dữ liệu web, phân tích dữ liệu và phân loại dữ liệu để tìm thông tin cụ thể, chi tiết về nghệ sĩ, bản ghi âm (bản nhạc), xu hướng người nghe và dự báo các sản phẩm âm nhạc được yêu thích. Ví dụ, phân loại nhạc theo cách người dùng thiết kế playlist của họ, cho các công ty sản xuất âm nhạc và các trang web phát nhạc trực tuyến cách họ nên trình bày các bài nhạc, nghệ sĩ đến khách hàng. Chọn ra playlist tốt nhất dựa theo thể loại âm nhạc, nghệ sĩ và các bài nhạc có phong cách phù hợp, sẽ mang lại lợi nhuận cho các nghệ sĩ. Ngoài ra, còn hỗ trợ khách hàng trong việc tìm kiếm những sản phẩm âm nhạc mình thích tốt hơn. Vì các dịch vụ phát nhạc trực tuyến dựa vào lượt đăng ký trả phí từ khách hàng, nếu hiểu được nhu cầu của người nghe sẽ cho phép họ tiếp tục mang lại giá trị kinh doanh và tăng lượng người đăng ký mới mỗi năm. Xử lý một cách sáng tạo lượng dữ liệu khổng lồ và đa dạng giúp Spotify tăng vọt từ 10 triệu đến 20 triệu người đăng ký trong hai năm từ 2014 – 2016. Ngoài ra, việc thích nghi và đáp ứng tốt hơn nhu cầu của khách hàng đã giúp Spotify trở thành ông lớn trong ngành công nghiệp âm nhạc.
Phân tích dữ liệu người xem để xác định hành vi mong muốn
Ngoài mục đích phân tích dữ liệu lịch sử có thể hỗ trợ để xác định những đặc điểm, yếu tố giúp một bộ phim chiếu rạp hay phim truyền hình có thể thu hút được nhiều người xem hay không, có thể thúc đẩy người xem lan tỏa ra cộng đồng, xã hội, đến bạn bè, người thân, và dần tạo thành cơn sốt, đó là những hiệu ứng tích cực, còn tiêu cực như bị tẩy chay, lên án,… thì phân tích dữ liệu lịch sử về hành vi như khi người dùng tạm dừng, chuyển tiếp, tua lại, phát lại hoặc dừng một bộ phim truyền hình cung cấp nhiều thông tin có giá trị. Kết hợp với hồ sơ chi tiết (dữ liệu cá nhân) của người xem cũng như nhiều dữ liệu khác nhau liên quan do người xem tạo ra cực kỳ giá trị cung cấp thông tin chuyên sâu về giải thích một bộ phim có thành công hay không.
Ví dụ điển hình là series phim ăn khách, đình đám nhất của Netflix “Ván bài chính trị” tên tiếng Anh “House of Cards”, Netflix phân tích hàng triệu người xem của mình thì thấy rằng đa số người xem của mình thích phong cách “marathon” – đây là thuật ngữ ngành điện ảnh của Mỹ – người xem muốn theo dõi liên tục các tập phim thay vì chờ đợi nó hàng tuần. Thông qua các chiến dịch marketing hiệu quả trước khi công chiếu, Netflix nhận định đây sẽ là bom tấn, sẽ thu hút rất nhiều người xem, và với phong cách “marathon” đã xác định trước đó, Netflix quyết định đi ngược lại với cách thức phát sóng truyền thống, đi ngược lại với các hối thủ cạnh tranh của mình như HBO để phát sóng 1 lúc 13 tập phim của mùa một. Hiệu quả rõ rệt khi số người xem cao và được duy trì, trung bình 1 người xem 1 ngày có thể xem 6/13 tập (theo báo cáo của Netflix) tuy nhiên Netflix lại không thể mở rộng khách hàng tiềm năng của mình. Điển hình, Google trend cho thấy lượng người search về “House of Cards” giảm, cơn sốt về bộ phim cũng giảm, nguyên nhân do người xem có thể xem hết 13 tập, họ có thể biết toàn bộ nội dung vậy việc gì phải lên các trang mạng xã hội để lại comment, bàn luận, dự báo nội dung của phim mặc dù họ có thể khen bộ phim hay, và lan tỏa chúng nhưng không còn quá nhiều sự tò mò. Phân tích dữ liệu để ra quyết định lại gián tiếp khiến Netflix thua cuộc trong việc giúp bộ phim nổi tiếng hơn đặc biệt trên các nền tảng Social media. “Games of Thrones” – “Trò chơi vương quyền” – không công chiếu tất cả các tập một lúc nhưng lại thành công hơn “House of Cards” không những lượng người xem rất cao, mà luôn là chủ đề nằm trong “top trending” mỗi khi trở lại ở những mùa khác nhau.
Ở bài viết phần 2 chúng ta sẽ đi sâu hơn vào ví dụ “House of Cards” của Netflix để biết cách tổ chức này sử dụng dữ liệu để tăng giá trị lợi nhuận mà bộ phim này mang lại.
Phân tích dữ liệu có thể cho chúng ta biết nhiều thông tin để hỗ trợ ra quyết định mang lại giá trị kinh doanh nhưng cần có sự cân nhắc thật kỹ.
Tăng trải nghiệm hơn cho người xem
Nếu các bạn là fan của tennis, của bộ môn quần vợt và thường xuyên theo dõi các giải đấu, thì có thể thấy chữ “IBM” xuất hiện trên các sân vận động. Từ lâu, IBM – công ty hàng đầu trong lĩnh vực công nghệ, dữ liệu – là đối tác công nghệ lớn của các giải đấu, điển hình là giải Grandslam Úc Mở rộng – Australia Open với trên 20 năm. IBM, trong năm 2013, đã biến giải Úc mở rộng thành giải đấu không chỉ để “xem” mà là giải đấu đầu tiên thu hút tương tác của người xem, là giải đấu cung cấp kho tàng dữ liệu về những vận động viên tennis mà người xem quan tâm nhất, và cho phép họ vote vận động viên mình thích.
Cụ thể, IBM đã phát triển công nghệ mới để thu thập dữ liệu của các trận đấu, của từng vận động viên khi giải đấu diễn ra, thống kê, phân tích và chia sẻ chúng đến nhiều đến tảng, nhiều thiết bị khác nhau để người xem có thể tiếp cận.
Nhờ vào đó, các fan hâm mộ, các nhà báo, các nhà phân tích, các hãng truyền thông có thể truy cập dữ liệu thống kê, các biểu đồ trực quan trong thời gian thực về vận động viên (người xem có thể vừa theo dõi trận đấu trên TV vừa theo dõi số liệu qua ứng dụng trên điện thoại), về tất cả các trận đấu mình quan tâm một cách chi tiết nhất, ngoài ra cũng cho phép tìm hiểu dữ liệu lịch sử của các giải grand slam trong các năm trở lại đây.
Công nghệ IBM – Slam Tracker cung cấp những phân tích chuyên sâu về phong độ, kỹ năng của từng vận động viên trong quá khứ và xác định các yếu tố mà họ cần để giành chiến thắng, kết hợp với dữ liệu hiện tại, người xem có thể biết được hay dự báo liệu tay vợt mình thích có khả năng vô địch hay không.
Tóm lại giải pháp của IBM giúp người xem trải nghiệm một trận đấu tennis với cương vị là một “chuyên gia phân tích thể thao” thay vì một khán giả thông thường.
Tương tự như IBM, Spotify cũng sử dụng các công nghệ phân tích dự báo để tăng trải nghiệm khách hàng hơn, thu hút họ tương tác, ví dụ mỗi năm khi giải Grammy diễn ra, Spotify phân tích dữ liệu để dự báo nghệ sĩ nổi tiếng nào sẽ đạt giải Grammy, và khá bất ngờ khi các kết quả dự báo của Spotify có tỷ lệ chính xác khá cao làm những người nghe nhạc trên Spotify cảm thấy thích thú, quan tâm nhiều hơn đến sự kiện Grammy, đặc biệt có thể thúc đẩy họ nghe những sản phẩm âm nhạc nổi tiếng mà họ chưa từng nghe qua.
Dưới đây là ví dụ danh sách dự báo những ứng viên đạt giải Grammy của Spotify vào tháng 1/2014
Đến đây chúng tôi xin tạm ngưng phần 1 bài viết tại đây, ở phần 2 chúng ta sẽ đi sâu hơn về cách Netflix tận dụng phân tích dữ liệu của mình để đem lại giá trị kinh doanh.
Mong các bạn tiếp tục ủng hộ BigDataUni
Tài liệu tham khảo
www.pwc.com/gx/en/industries/tmt/media/outlook.html
vwo.com/blog/deliver-personalized-recommendations-the-amazon-netflix-way/
https://datafloq.com/read/paradigm-shift-awaits-media-entertainment-industry/177
https://datafloq.com/read/the-australian-open/518
misclassblog.com/data-analytics/data-mining-in-entertainment/
https://www.qubole.com/big-data-in-media-and-entertainment/
https://www.qubole.com/blog/media-companies-using-big-data/
http://blog.springtab.com/personalization-examples-netflix/
Về chúng tôi, công ty BigDataUni với chuyên môn và kinh nghiệm trong lĩnh vực khai thác dữ liệu sẵn sàng hỗ trợ các công ty đối tác trong việc xây dựng và quản lý hệ thống dữ liệu một cách hợp lý, tối ưu nhất để hỗ trợ cho việc phân tích, khai thác dữ liệu và đưa ra các giải pháp. Các dịch vụ của chúng tôi bao gồm “Tư vấn và xây dựng hệ thống dữ liệu”, “Khai thác dữ liệu dựa trên các mô hình thuật toán”, “Xây dựng các chiến lược phát triển thị trường, chiến lược cạnh tranh”.