Phân tích dữ liệu chiến dịch quảng cáo (P.2)

Bigdatauni.com Follow Fanpage Contact

Quay trở lại với chủ đề ứng dụng phân tích dữ liệu trong marketing lấy ví dụ phân tích dữ liệu của các chiến dịch quảng cáo để tìm hiểu chuyện gì đã xảy ra với các chiến dịch, đánh giá hiệu quả, xác định các yếu tố thành công của một chiến dịch quảng cáo, đưa ra các thay đổi và thử dự báo kết quả các chiến dịch. Thông qua các bài viết các bạn sẽ phản ánh ngược trở lại với thực tế để trả lời câu hỏi “liệu có thể thấy được cái yếu tố quyết định thành công của một chiến dịch quảng cáo hay có thể dự báo được kết quả chiến dịch?” khi nền tảng quảng cáo Facebook luôn nhiều “biến cố” bất ngờ.

Nguồn hình: iStockphoto

Ở phần 1, BigDataUni và các bạn đã tìm hiểu sơ lược về Digital marketing, nói một chút về quảng cáo Facebook, giới thiệu qua ví dụ phân tích với dữ liệu mẫu về kết quả chiến dịch quảng cáo được BigDataUni xây dựng, khám phá một số biến trong dữ liệu và mối quan hệ giữa chúng, trên cơ sở nghiên cứu những gì đã xảy ra với các chiến dịch quảng cáo.

Tiếp tục phần 2, chúng ta sẽ tìm hiểu các biến quan trọng còn lại, đánh giá hiệu quả quảng cáo theo từng sản phẩm, đưa ra những suy luận, tiến hành kiểm định, sau đó xác định các yếu tố tác động lên sự thành công của chiến dịch quảng cáo (xét trong tập dữ liệu), tiến hành các thay đổi và dự báo.

 Lưu ý, dữ liệu mẫu chúng tôi sử dụng không phải dữ liệu thật của bất kỳ công ty, cá nhân nào và chỉ là dữ liệu minh họa để các bạn thấy được cách ứng dụng Data analytics mà thôi.

Vì thế, sẽ có thể có những điểm bất hợp lý trong dữ liệu mà các bạn sẽ thấy dựa trên kiến thức, kinh nghiệm của mình về Facebook ads, tuy nhiên BigDataUni mong các bạn thông cảm và tiếp nhận bài viết dưới góc độ Data analytics trong marketing chứ không phải chuyên môn sâu về Digital marketing.

Cũng lưu ý thêm, qua ví dụ mẫu mà chúng tôi sẽ trình bày dưới đây không bao gồm việc hướng dẫn các bạn cách tối ưu các chiến dịch quảng cáo Facebook trong thực tế, vì nó phụ thuộc vào nhiều yếu tố như cách các bạn target khách hàng mục tiêu, cách các bạn đặt giá thầu, và phát triển content. Ví dụ chỉ cho các bạn thấy được lợi ích của Data analytics trong nghiên cứu chiến dịch quảng cáo.

Nhắc lại ví dụ trước, công ty sản xuất tai nghe không dây XM, có dữ liệu về kết quả của 500 chiến dịch quảng cáo triển khai trên Facebook của 5 sản phẩm khác nhau.

Dữ liệu thu thập gồm các biến dưới đây, chi tiết các biến các bạn xem lại bài viết trước. Dữ liệu có thể download tại đây.

  • Post ID: mã số chiến dịch
  • Strategy: mục tiêu chiến lược hướng đến.
  • Product: sản phẩm, bao gồm 5 sản phẩm XM – 01M, 02S, 03A, 04N, 05K, giá dao động từ 3 – 5 USD
  • Audience: cách target khách hàng, chúng ta chỉ có 5 cách Au1, Au2, Au3, Au4, Au5.
  • Objectives: mục đích chiến dịch.
  • Lifetime: thời gian chạy chiến dịch, tính theo ngày.
  • Cost: chi phí của mỗi chiến dịch, đơn vị USD, giả định công ty đặt ngân sách mỗi ngày để chạy.
  • Content: loại nội dung sử dụng, bao gồm:
  • Idea: ý tưởng sáng tạo hay cơ sở phát triển nội dung, concept chính
  • Impressions: số lượt tiếp cận khách hàng của bài viết quảng cáo, hay cụ thể là số lần quảng cáo được hiển thị đến người dùng Facebook, một người dùng có thể thấy quảng cáo hơn một lần.
  • Likes: số lượt thích
  • Shares: số lượt chia sẻ
  • Comments: số lượt bình luận
  • Clicks: số lượt nhấn vào liên kết trỏ về web, landing page, hay vào form đăng ký ưu đãi,…
  • Messages: số lượt khách hàng gửi tin nhắn trong giai đoạn triển khai chiến dịch.
  • Leads: số khách hàng tiềm năng có được từ chiến dịch là những khách hàng để lại thông tin chi tiết vào form đăng ký nhận ưu đãi, hay nhắn tin trực tiếp hỏi mua sản phẩm, hỏi về giá, hay cần tư vấn mua sản phẩm
  • Sales: doanh số của sản phẩm, số đơn hàng đã chốt, và nhận thanh toán.

Ở bài viết trước chúng ta đã tìm hiểu qua tất cả các biến định tính, và một số biến định lượng trong tập dữ liệu gồm các biến lifetime, cost và các biến mô tả hoạt động chiến dịch như Impressions, likes, shares, comments.

Tiếp tục bài viết này trước khi đi vào đánh giá hiệu quả, chúng ta cùng tìm hiểu nốt các biến còn lại – các biến mô tả về mặt hiệu suất, doanh thu. Đầu tiên là lượt click

Lượt click đóng vai trò quan trọng trong việc đánh giá nội dung quảng cáo có liên quan đến nhu cầu của khách hàng, tiếp thị có thu hút, có nhắm mục tiêu chính xác nhóm khách hàng, hiệu quả tiếp thị. Nếu khách hàng thấy nội dung quảng cáo đáp ứng tốt mong muốn, và nhu cầu của mình sẽ click vào link dẫn đến trang mua hàng, landing page, dẫn đến form liên hệ sẵn sàng điền vào form yêu cầu tư vấn, dẫn đến form cung cấp thông tin, hay trang đăng ký tham gia chương trình ưu đãi,…

Lượt click càng cao tỷ lệ chuyển đổi thành đơn hàng cũng sẽ gia tăng. Khác với số lượt comments, khi nhiều bạn cho rằng lượt bình luận cũng thể hiện được khả năng chuyển đổi thành đơn hàng. Cái này chính xác nhưng trong thực tế không phải khách hàng nào cũng thể hiện nhu cầu của mình vào phần bình luận, không phải khách hàng nào cũng sẽ bình luận “Inbox cho mình” hay “mình cần tư vấn”, nhiều admin fanpage của đối thủ sẽ comment trực tiếp “phá đám” các bạn hay spam những thứ không liên quan.

Thường các bạn sẽ phải lọc ra các comment của khách hàng để phản hồi, và dùng đó làm cơ sở để đánh giá hiệu quả chiến dịch. Nhưng trong ví dụ này chúng ta thiếu thông tin, và không thể xác định chính xác, nên sẽ chỉ tập trung vào lượt clicks.

Nếu xét theo sản phẩm, thì trung bình 1 chiến dịch về sản phẩm XM – 03A mang lại nhiều lượt click nhất, chênh lệch giữa sản phẩm có lượt click trung bình cao nhất không quá cao chỉ có 238 lượt click.

Nếu xét theo ý tưởng nội dung thì các chiến dịch quảng cáo có các nội dung liên quan đến ưu đãi trung bình sẽ có lượt click 2730, là cao nhất.

Nhưng nếu nhìn vào số chiến dịch quảng cáo phân theo ý tưởng nội dung và xét theo từng sản phẩm thì sản phẩm XM – 03A là sản phẩm có ít chiến dịch ưu đãi nhất.

Tuy nhiên mặc dù có ít chiến dịch promotion nhất nhưng sản phẩm XM – 03A lại hiệu quả nhất trong việc mang về nhiều lượt click nhất.

Chúng ta có thể thấy sản phẩm XM – 03A tuy có ít chiến dịch Promotion nhất, nhưng lại có số ngày chạy trung bình (biến Life-time) là 12 cao nhất, và chi phí trung bình mỗi chiến dịch cũng cao nhất là 955. Hai yếu tố này có thể là hai yếu tố tác động lên số lượt click.

Chúng ta còn 2 yếu tố khác cần xét đến là cách target khách hàng, mục tiêu chiến dịch.

Như vậy có thể thấy mục tiêu tăng doanh số (Purchases) mang lại nhiều click nhất xét trung bình một chiến dịch, đặc biệt trong mục tiêu này số chiến dịch có nội dung promotion là nhiều nhất chiếm hơn 80%.

Tiếp tục về cách target khách hàng. Chúng ta quan tâm đến yếu tố này vì target đúng khách hàng, đúng nhu cầu với nội dung quảng cáo phù hợp chúng ta sẽ tăng được lượt click.

Trung bình một chiến dịch quảng cáo được target theo cách thứ 2 mang lại nhiêu lượt click nhất.

Như vậy tạm thời chúng ta có thể thấy được để tăng lượt click cho một chiến dịch quảng cáo, công ty có thể hướng đến:

  • Nghĩ ra các chiến lược ưu đãi để thúc đẩy nhiều hơn các chiến dịch về Promotion vì sau cùng khách hàng cũng chỉ quan tâm đến ưu đãi
  • Kéo dài thời gian chạy chiến dịch từ 11 đến 12 ngày hoặc hơn, chi phí bỏ ra trên 930 USD cho toàn chiến dịch
  • Sử dụng các target thứ 2, có thể các khách hàng trong cách này có khả năng click cao hơn
  • Ưu tiên chọn sản phẩm XM – 03A, và lấy các nội dung quảng cáo viết cho sản phẩm này làm chuẩn cho các sản phẩm khác. Lý do mặc dù các sản phẩm khác cũng thỏa các điều kiện ở trên nhưng ngoại trừ yếu tố chi phí, và thời gian chạy của sản phẩm này cao hơn các sản phẩm khác, có thể có các nguyên nhân khác chúng ta chưa biết đến ví dụ sản phẩm XM – 03A được ưa thích hơn (tạm thời hãy khoan xét đến doanh số), giá cao mà nhiều ưu đãi hơn chăng (giá sản phẩm chúng ta sẽ nói ở phía dưới), hướng tiếp cận trong việc sáng tạo nội dung khác biệt nhiều?

Về yếu tố sản phẩm có tác động lên số lượt click trung bình một chiến dịch không, chúng ta phải thực hiện kiểm định ANOVA.

Các bạn nào chưa biết về ANOVA có thể tham khảo các bài viết dưới đây của chúng tôi, chúng tôi sẽ không giải thích phần lý thuyết trong bài viết này.

Phân tích phương sai – Anova (Analysis of variance) (P.1) – 1 yếu tố

Phân tích phương sai – Anova (Analysis of variance) (P.2) – 2 yếu tố

Mục đích của phân tích phương sai ANOVA là tìm hiểu xem sản phẩm khác nhau sẽ ảnh hưởng như thế nào đến lượt click.

Đặt giả thuyết H0: sản phẩm khác nhau sẽ ảnh hưởng như nhau đến lượt click trung bình của chiến dịch quảng cáo, hay nói cách khác, khách hàng không dựa trên sản phẩm để thực hiện việc click, yếu tố sản phẩm không tác động đến lượt click.

Nếu P-value của kiểm định F (cội Sig) < 0.05, chúng ta bác bỏ H0, kết luận số lượt click trung bình của một chiến dịch sẽ khác nhau giữa các sản phẩm khác nhau hay yếu tố sản phẩm tác động đến việc khách hàng click, và xét ngược lại.

Ở kết quả trên từ phần mềm SPSS Statistics, giá trị cột Sig = 0.063 > 0.05, nên chúng ta không bác bỏ H0 tức số lượt click trung bình của một chiến dịch sẽ không khác biệt giữa các sản phẩm, yếu tố sản phẩm không tác động lên quyết định click của khách hàng, kết luận với độ tin cạy 95%.

Phân tích ANOVA là phương pháp khá hay mà các bạn nên tìm hiểu, thông qua các lý thuyết, công thức các bạn sẽ hiểu hơn về cơ chế vận hành của nó.

Ở đồ thị đầu tiên, số click trung bình 1 chiến dịch xét giữa các sản phẩm có sư khác biệt nhưng không quá chênh lệch. Nếu chỉ dựa vào đồ thị mà cho rằng yếu tố sản phẩm có thể tác động lên số lượt click thì thiếu cơ sở. Lúc này chúng ta sẽ cần đến ANOVA.

Lưu ý thêm về kết luận từ ANOVA, số lượt click trung bình trong 1 chiến dịch giữa các sản phẩm là không khác biệt nhưng trong những chiến dịch của một sản phẩm sẽ có một số chiến dịch có lượt click cao, một số thì trung bình, và còn lại là thấp, nguyên nhân có thể do các yếu tố khác chúng ta chưa xét đến ví dụ loại nội dung, ý tưởng nội dung, cách target khách hàng,….

Các bạn có thể triển khai thực hiện ANOVA cho các yếu tố này, lý do như đã nói chúng ta cần cơ sở toán học để kết luận bên cạnh việc đánh giá qua biểu đồ.

Đối với những yếu tố ở phía khách hàng mà không có trong tập dữ liệu thì chúng ta không thể phân tích. Cho nên không phải công cụ phân tích nào cũng mạnh tuyệt đối!

ANOVA có thể thực hiện trên cả Excel và phần mềm SPSS nhưng trước đó bạn cần hiểu cơ bản về lý thuyết thống kê, và ANOVA.

Các bạn nào chưa xem qua các bài viết về phương pháp thống kê, cũng như phương pháp kiểm định, phương pháp kiểm định hệ số tương quan thì có thể tham khảo các bài viết của chúng tôi.

Tổng quan về Statistics: Descriptive statistics (thống kê mô tả)

Tổng quan về Statistics: Inferential statistics (thống kê suy luận)

Tìm hiểu về phương pháp kiểm định tham số

Phương pháp kiểm định trong tương quan và hồi quy tuyến tính

Tiếp tục chúng ta cùng xem xét liệu có sự tác động của nội dung quảng cáo lên khả năng click của khách hàng không, sử dụng ANOVA.

Giá trị tại cột Sig, P-value của kiểm định F của phương pháp ANOVA theo kết quả ở trên < 0.05, kết luận ý tưởng nội dung như Lifestyle – phong cách sống, Promotion – khuyến mãi, Main features – tính năng chính sản phẩm, Trendy – bắt trend, tác động lên việc khách hàng click, kết luận với độ tin cậy 95%. Số lượt click trung bình một chiến dịch giữa các ý tưởng nội dung khác nhau sẽ khác nhau.

Tương tự cách target khách hàng, và loại nội dung. Nhưng lần này chúng ta không sử dụng ANOVA 1 yếu tố như ở trê mà dùng phương pháp ANOVA 2 yếu tố.

Chúng ta chỉ quan tâm giá trị ở cột Sig, P-value của 2 biến chính, thì sig value ở Audience > 0.05, với độ tin cậy 95%, thì kết luận không có tác động của việc target khách hàng lên số lượt click, hay giải thích cách khác đặc điểm khách hàng khác nhau không ảnh hưởng việc khách hàng đó có click vào quảng cáo. Về content, loại nội dung, thì p-value < 0.05, với độ tin cậy 95%, thì khách hàng thường bị tác động bởi loại nội dung khi click. Hay nói cách khác, loại nội dung khác nhau như văn bản, hình ảnh, video sẽ ảnh hưởng đến việc khách hàng click.

Như theo đồ thị dưới đây, lượt click trung bình chiến dịch có nội dung là văn bản kết hợp hình ảnh cao hơn nhiều so với 2 loại nội dung còn lại, có thể nói khách hàng click thường xuyên hơn.

Về kết quả phân tích ở trên, ở dòng “Audience * Content”, p-value bằng 0.864 > 0.05, nghĩa là mối quan hệ tương tác giữa loại nội dung và cách target khách hàng không tác động lên việc khách hàng click vào quảng cáo. Ví dụ, công ty target khách hàng theo cách thứ 2 (Au2) và thường ưu tiên sử dụng text & video cho các chiến dịch target theo cách này, nhưng sẽ không tác động đến lượt click.

Đối với biến clicks hay các biến định lượng khác như sales, chúng ta có thể tìm mối quan hệ giữa chúng với các yếu tố là biến định tính như sản phẩm, nội dung quảng cáo, cách quảng cáo, còn các biến định lượng thì như thế nào. Chúng ta sẽ sử dụng ma trận hệ số tương quan Pearson. Hệ số tương quan Pearson áp dụng để tìm hiểu mối quan hệ giữa 2 biến định lượng.

Giải thích lại biến định lượng, biến định tính cho bạn nào chưa biết. Biến định tính hay biến phân loại là biến phản ánh tính chất, hay loại, là biến định danh, không có biểu hiện trực tiếp bằng con số, chủ yếu bằng chữ, chuỗi ký tự gồm chữ cái và số. Biến định lượng là biến biểu hiện trực tiếp bằng con số, các giá trị hơn kém nhau rõ ràng.

Theo lý thuyết rxy, tức hệ số tương quan Pearson nằm từ -1 đến +1

  • Nếu hệ số rxy < 0, thì 2 biến có mối quan hệ theo chiều nghịch nhau, tức một biến tăng thì biến còn lại sẽ giảm hoặc ngược lại.
  • Hệ số rxy > 0 thì 2 biến có mối quan hệ thuận, một biến tăng, biến còn lại có thể tăng theo hoặc ngược lại.
  • Hệ số rxy = 0, thì 2 biến không có mối quan hệ tuyến tính với nhau.
  • Hệ số rxy  càng tiến gần giá trị -1, mối liên hệ nghịch càng chắc chắn, tương tự với giá trị 1, mối liên hệ thuận càng chắc chắn.

Các bạn xem lại bài viết dưới đây để rõ hơn về tương quan và hồi quy:

Correlation (tương quan) & Linear regression (hồi quy tuyến tính)

Tổng quan về Regression (phân tích hồi quy)

Dựa trên kết quả, các bạn xem ở dòng clicks, hệ số Pearson đối với các biến Cost, impressions, likes, shares, comments đều > 0, thuận chiều, trong đó số lượt likes, số lượt shares có hệ số 0.9 và 0.8 thể hiện mối quan hệ bền vững. Nghĩa là khách hàng likes và shares khả năng click nhiều hơn.

Các dòng Sig là giá trị P-value kiểm định hệ số Pearson đều nhỏ hơn < 0.01 (mức ý nghĩa 1%, độ tin cậy 99%) tức khẳng định tất cả mối quan hệ giữa các biến đều có ý nghĩa thống kê.

Cũng qua kết quả trên việc tăng chi phí (cost), tăng số ngày chạy chiến dịch (life-time) có thể sẽ tăng lượt tiếp cận (impressions) với các hệ số tương quan đều lớn hơn 0 và tiến gần 1. Impressions tăng khiến cho lượt click tăng nhưng mức độ tăng sẽ không mạnh, hay mối quan hệ thuận chiều này chưa chắc bền vững khi hệ số tương quan chỉ bằng 0.589 không gần 1.  

Dựa trên những gì chúng ta biết về các yếu tố định tính, định lượng, công ty có thể thay đổi những gì và các thay đổi này sẽ tác động như thế nào đến lượt click, chúng ta sẽ xây dựng mô hình hồi quy tuyến tính đa biến (Multi – linear regression)

Các bạn có thể xem qua các bài viết của chúng tôi về chủ đề hồi quy:

Tổng quan về Regression (phân tích hồi quy)

Correlation (tương quan) & Simple linear regression (hồi quy tuyến tính đơn giản)

Phương pháp kiểm định trong tương quan và hồi quy tuyến tính đơn biến

Hiểu hơn về Linear regression thông qua ví dụ ứng dụng trong bán lẻ (p.1) 

Chúng ta có các biến như sau:

  • Biến mục tiêu: Clicks (dependent variable)
  • Biến dự báo: Objectives, Content, Idea, Cost, Lifetime.

Biến Objectives suy ra từ biến Strategy, biến % Avg video view bị mất giá trị ở các quan sát có giá trị tại biến Content là Text & Image. Biến Audience, và Product như đã phân tích ở trên không phù hợp để phân tích. Nên chúng ta loại bỏ 4 biến này khỏi mô hình.

Các biến Impressions, Likes, Shares, Comments là biến kết quả như biến Clicks, chúng ta đang nói đến các yếu tố mà công ty có thể điều chỉnh, còn các yếu tố này phụ thuộc vào nền tảng quảng cáo Facebook (giả định công ty không thực hiện các biện pháp khác tăng lượt tiếp cận, lượt likes,…)

Đầu tiên đối với các biến định tính Objectives, Content, Idea chúng ta sẽ tạo ra biến giả, biến dummy hay biến nhị phân gồm 2 giá trị 0, 1.

Ví dụ Objectives có 6 giá trị định tính Engagement, Messages, Purchases, Video views, Traffic, Reach, sẽ có 6 biến giả. Ví dụ ObEngagement là 1 biến giả, nếu chiến dịch có objectives là engagement thì giá trị ở biến ObEngagement sẽ là 1, ngược lại bằng 0. Đưa vào mô hình sẽ chỉ có thể (6 – 1) là 5 biến mà thôi. Vì nếu 1 biến Ob này có giá trị bằng 1 thì tất cả các biến Ob còn lại có giá trị bằng 0, và khi cả 5 biến Ob có giá trị bằng 0 thì biến Ob thứ 6 chắc chắn bằng 1. Tương tự như biến Idea có 4 biến giả, nhưng chỉ có 3 biến đưa vào mô hình. Phần mềm SPSS sẽ tự động thực hiện giùm các bạn.

Chúng ta có tất cả 12 biến dự báo, hệ số R2 còn thấp chỉ 0.416, nghĩa là chỉ có 41.6% giá trị thay đổi của biến mục tiêu Clicks được giải thích bởi các biến độc lập trong mô hình. 59.4% còn lại chúng ta sẽ không dự đoán được hay tìm được nguyên nhân. Mặc dụ giá trị p-value của kiểm định ANOVA thấp hơn 0.05, ít nhất một trong các biến độc lập đều có tác động lên clicks. Tuy nhiên khi nhìn vào kết quả Coffecients, ở cột sig, cột thể hiện các giá trị P-value của kiểm định hệ số hồi quy B. Nếu p-value > 0.05, nghĩa là hệ số hồi quy của biến độc lập đó có thể bằng 0, lúc này không có mối quan hệ giữa biến độc lập đó và biến mục tiêu Clicks, biến độc lập này không có ý nghĩa phân tích.

Chúng ta thấy có nhiều biến  độc lập có giá trị tại cột Sig > 0.05, như 3 biến giả của biến Idea, đều không có ý nghĩa để thêm vào mô hình.

Hơn nữa ở cột VIF (Variance Inflation Factor) nhiều biến có giá trị lớn hơn 2, phản ánh nguy cơ mô hình gặp vấn đề Đa cộng tuyến, nếu lớn hơn 10 chắc chắn có đa cộng tuyến.

Hiện tượng đa cộng tuyến là việc các biến độc lập có mối quan hệ với nhau và ảnh hưởng đến kết quả của mô hình có thể bị thiếu chính xác.

Để tối ưu mô hình, chúng ta sử dụng phương pháp Stepwise trong hồi quy tuyến tính.

Stepwise regression là quá trình xem xét từng biến độc lập x khi thêm vào mô hình. Đầu tiên là tính giá trị kiểm định F cho mô hình có biến x và p-value cho lần lượt từng biến x để xem có loại biến đó hay không. Nếu biến này có ý nghĩa phân tích và được thêm vào, chúng ta có phương trình hồi quy tuyến tính. Tiếp theo bỏ thêm một biến x khác vào phương trình này, và tính lại giá trị kiểm định F hay p – values cho từng biến, nếu các biến đều có ý nghĩa phân tích chúng ta sẽ tiếp tục giữ trong mô hình, còn không thì loại biến không phù hợp và xét tiếp đến biến thứ 3, làm tương tự cho đến khi hết biến để thêm vào hay loại bỏ.

Bên cạnh kiểm định F hay p – values, chúng ta có thể sử dụng hệ số xác định R2, hay hệ số điều chỉnh R2 để xét cho từng biến thêm vào hay loại bỏ, bắt đầu từ mô hình 1 biến, và thêm lần lượt từng biến, kiểm tra mỗi mô hình, nếu hệ số không tăng tức biến không có ý nghĩa khi thêm vào mô hình.

Dưới đây là mô hình tối ưu theo kết quả SPSS:

Chúng ta xem model 2, là mô hình sau cùng, chỉ còn 2 biến cost và ObPurchases, giá trị tại cột Sig, VIF thỏa mãn yêu cầu.

Y(Clicks) = 1709.888 + 1.039*Cost + 155.109*ObPurchases

Ví dụ, công ty xác định mục tiêu chiến dịch là Purchases, cost bỏ ra cho toàn chiến dịch là 1000 USD. Hệ số hồi quy 1.039 tức tăng 1 USD sẽ tăng 1 click, và nếu sử dụng chiến dịch Purchases thay vì chiến dịch khác sẽ tăng được 155 click. Lưu ý biến ObPurchases là biến nhị phân 0: không có sử dụng mục tiêu này, 1: có sử dụng mục tiêu này

Y(Clicks) = 1709.888 + 1.039*1000 + 155.109*1 = 2903

Công ty sẽ đạt được 2903 click. Đây chỉ là dự báo, và chắc chắn có sai số trong thực tế. Nếu lấy dữ liệu hiện tại đưa vào mô hình thì sai số dưới 500 click chiếm 70%. Sai số cao nhất là 1000 click.

Đây chỉ là ví dụ minh họa đơn giản cho các bạn về ứng dụng Multilinear regression trong phân tích chiến dịch quảng cáo. Trong Multilinear Regression còn nhiều kiến thức khác rất hữu ích để tối ưu công cụ này, BigDataUni khuyên bạn nên trang bị thêm kiến thức nếu có cơ hội.

Chúng ta đã tìm hiểu về Clicks cũng thử xác định các yếu tố tác động lên nó, lập mô hình và dự báo. Chúng ta tiếp tục phân tích hiệu quả hoạt động tổng quan của chiến lược quảng cáo Facebook của công ty.

Ngoài Clicks chúng ta còn có 3 biến quan trọng khác là Messages, Leads, Sales.

Messages cũng quan trọng không kém gì Clicks. Clicks cho thấy nội dung quảng cáo phù hợp với nhu cầu của khách hàng, đã thu hút được khách hàng nhấn vào link mua hàng, hay bất kể link khác để đưa họ đến trang đích hay còn gọi là landing page, trang thanh toán,… để ra quyết định mua hàng sau cùng. Khác với Clicks, messages cho thấy khách hàng muốn được biết nhiều hơn, muốn được thỏa mãn hơn so với những gì công ty đã cung cấp qua nội dung quảng cáo.

Số lượt messages nhiều cũng có ưu và khuyết điểm riêng. Ưu điểm có thể tiếp cận nhiều khách hàng mới, khách hàng tiềm năng, tương tác với họ, thúc đẩy họ ra quyết định vì có rất nhiều khách hàng đưa bước thanh toán sau cùng chỉ vì thiếu một chút động lực, thiếu gì đó gọi là niềm tin thôi thúc, khiến họ dừng mua.

Khuyết điểm là không phải lúc nào messages nhiều cũng là thành công vì nó cho thấy nội dung quảng cáo chưa thực sự thuyết phục, hay thậm chí khó hiểu khiến khách hàng phải nhắn tin nhờ tư vấn, nếu công ty có đội ngũ nhân viên CSKH dồi dào, chuyên nghiệp thì rất tốt ngược lại thì hậu quả mất khách hàng. Có những tin nhắn không phải thể hiện nhu cầu mua hàng, hoặc đối thủ cạnh tranh dò xét,…

Messages nhìn chung vẫn đóng vai trò quan trọng, vì công ty có cơ hội hiểu thêm về khách hàng của mình. Bất lợi ở chỗ làm sao để đánh giá chính xác chiến dịch nào mang về khách hàng tiềm năng thông qua messages, hơn nữa việc tracking theo từng chiến dịch có thể sẽ khó trừ khi công ty sử dụng công cụ thu thập dữ liệu thống kê, sử dụng tín năng quảng cáo Facebook với mục tiêu Messages, hoặc trực tiếp làm bằng tay, manual, yêu cầu nhân viên note lại các messages sản phẩm nào sẽ về sản phẩm đó.

Để đánh giá chính xác hơn, công ty sử dụng số liệu ở biến Leads. Biến leads là biến thể hiện thông tin của những khách hàng tiềm năng. Khách hàng này bao gồm những khách hàng nhắn tin trực tiếp hỏi mua hàng, những khách hàng điền thông tin đăng ký ưu đãi, những khách hàng để lại thông tin liên hệ trên form, những khách hàng comment yêu cầu mua hàng vào bài post quảng cáo,…

Leads tăng thể hiện hiệu quả marketing của chiến dịch quảng cáo. Nhưng Sales mới là cái công ty quan tâm sau cùng. Đó là doanh số có được từ leads. Nó thể hiện hiệu quả trong hình thức thanh toán, các tiện ích nhanh chóng, thể hiện nội dung trang đích, trang sản phẩm cung cấp đầy đủ nội dung thu hút khách hàng ra quyết định, thể hiện khả năng thuyết phục khách hàng từ đội ngũ sales, đội ngũ nhân viên CSKH. Sales là chỉ số đánh giá cả về thành công của hoạt động Marketing, thành công của hoạt động bán hàng, thành công của các dịch vụ chăm sóc.

Clicks, Leads, Sales thường được dùng để tính hiệu quả đầu tư marketing, riêng Messages thường áp dụng nhiều cho các công ty tư vấn, dịch vụ, kinh doanh sản phẩm có giá trị, và vì bài viết có giới hạn nên chúng tôi tập trung vào Clicks, Leads, và Sales thôi.

Để tính hiệu quả đầu tư Marketing chúng ta sẽ tính toán những chỉ số quen thuộc sau:

  • CPM (Cost per mile): chi phí cho 1000 lượt tiếp cận, tính bằng cách lấy chi phí chiến dịch chia cho tổng lượt tiếp cận rồi nhân với 1000
  • CTR (Click through rate): tỷ lệ lượt click trên lượt tiếp cận, số click chia/ số tiếp cận
  • CPC (Cost per click): chi phí trên một lượt click
  • CR (Conversion rate): tỷ lệ chuyển đổi, trong ví dụ này cách tính lấy doanh số, số đơn hàng chia cho tổng lượt click, tổng lượt tin nhắn của chiến dịch. Lưu ý, lượt click, tin nhắn tính trên 1 một khách hàng. CR trong thực tế có nhiều cách tính, tùy theo mục đích nghiên cứu của marketer
  • CPL (Cost per lead): chi phí cho 1 khách hàng tiềm năng
  • CPS (Cost per sale) chi phí cho 1 đơn hàng
  • ROAS (Return on Ads spent): lợi nhuận thu về trên chi phí quảng cáo, thu về bao nhiêu đồng trên 1 đồng quảng cáo
  • Lead to sales: tỷ lệ chốt đơn hàng thành công, công thức Leads/ Sales
  • Investment/ Revenue: tỷ lệ chi phí marketing trên doanh thu

Chúng ta sẽ tính cho hiệu quả chiến dịch theo từng sản phẩm và theo từng mục tiêu. Các bạn vẫn có thể phân tích sâu hơn sau khi có kết quả nhưng do bài viết có giới hạn nên chúng tôi không đi chi tiết.

Bên trên là kết quả tính mẫu cho 10 chiến dịch. Cách tính khá đơn giản. Lưu ý trên hình dấu chấm thập phân hơi nhỏ.

Biến Target, là biến xác định chiến dịch nào đạt mục tiêu công ty đề ra. Có nhiều chỉ số nhưng đơn giản nhất là công ty sử dụng tỷ lệ Investment/ Revenue, chi phí chia cho doanh thu.

Doanh thu được tính bằng cách lấy giá sản phẩm đó nhân với doanh số, giá sản phẩm như sau:

Bên cạnh chi phí marketing, công ty còn phải thanh toán chi phí vận chuyển, đóng gói, nên mục tiêu đạt ra chi phí marketing chỉ chiếm dưới 30% doanh thu, tức 30% chi phí sẽ tạo ra 70% lợi nhuận.

Trên kết quả tính thử, chúng ta thấy có một chiến dịch XM – 02S, đạt được target nên tại biến target có giá trị bằng 1. Nếu quan sát kỹ các bạn sẽ thấy các chỉ số CPM, CPL, CPC, CPS thấp nhất nhưng ROAS lại cao nhất. Đây là chiến dịch đạt hiệu quả rất cao mặc dù tỷ lệ chuyển đổi lại thấp chỉ 13%, chiến dịch có thể thành công hơn nữa nếu các hoạt động chăm sóc, bán hàng tốt hơn, cải thiện tỷ lệ chuyển đổi. Dưới đây là kết quả trung bình của từng sản phẩm

Đối với sản phẩm XM – 01M chiến dịch tối ưu là chiến dịch Reach, tỷ lệ chi phí đầu tư/ doanh thu thấp nhất có 40%, và số chiến dịch đạt mục tiêu là 12.

Đối với sản phẩm XM – 02S chiến dịch tối ưu là chiến dịch Reach, với 18 chiến dịch đạt mục tiêu, tỷ lệ chi phí đầu tư/ doanh thu thấp nhất có 33%.

Các bạn nhận xét tương tự cho các sản phẩm khác. Nếu đánh giá tổng quan, thì tất cả các sản phẩm, chiến lược Reach đem lại nhiều thành công nhất, riêng sản phẩm XM – 05K có thêm chiến dịch Purchases cũng thành công không kém.

Câu hỏi dành cho các bạn tại sao lại là chiến dịch Reach, trong khi chiến dịch Reach chi phí trung bình bỏ ra là thấp nhất, thời gian chạy trung bình không dài, nhưng lại hiệu quả nhất? Do chiến dịch này tăng được lượt tiếp cận và lượt tiếp cận.

Về các chỉ số thì tùy thuộc vào benchmark của ngành, mục tiêu của công ty mà có những góc nhìn riêng, nên trong ví dụ này chúng tôi không trình bày gì thêm, một phần là các chỉ số này quá quen thuộc với các bạn.

Tiếp theo để có một chiến dịch đạt mục tiêu thì các chỉ số cần đạt giá trị trung bình là bao nhiêu? Dưới đây là kết quả.

Phần cuối của bài viết chúng ta sử dụng mô hình hồi quy logistic để xác định các yếu tố tác động lên biến target, hay nói cách khác để một chiến dịch thành công thì cần yếu tố gì.

Các bạn nào chưa biết đến hồi quy Logistic có thể tham khảo các bài viết của chúng tôi tại đây

Tổng quan về Logistic regression (hồi quy Logistic) (Phần 1)

Tổng quan về Logistic regression (hồi quy Logistic) (Phần 2)

Tổng quan về Logistic regression (hồi quy Logistic) (Phần 3)

Tổng quan về Logistic regression (hồi quy Logistic) (Phần 4)

Tổng quan về Logistic regression (hồi quy Logistic) (Phần 5)

Giải thích ngắn gọn về Logistic regression, thì logisctic regression cũng giống hồi quy tuyến tính nhưng biến mục tiêu của nó là biến nhị phân, và các biến đầu vào, hay các biến dự báo sẽ được định lượng mối quan hệ với biến mục tiêu thông qua các hệ số hồi quy. Phương trình tổng quát của logistic regression sẽ giúp chúng ta dự báo được khả năng một chiến dịch có thể đạt target hay không. Phương trình tổng quát:

Khác với hồi quy tuyến tính, kết quả của phương trình hồi quy logistic là xác suất và dựa vào xác suất để quyết định giá trị sau cùng của biến y. Đối với hồi quy logistic, biến y chỉ có 2 giá trị ví dụ như có và không, thành công và thất bại, sống sót và chết, còn sử dụng dịch vụ và không còn sử dụng dịch vụ thông thường theo thông lệ các chuyên gia phân tích sẽ gán y = 0 cho các kết quả “không”, “thất bại”, “chết”, “rời dịch vụ”, còn gán y = 1 cho giá trị còn lại

Với p là biến phụ thuộc, xác suất khả năng y xảy ra 0 hoặc 1 (chịu ảnh hưởng của biến x), là biến chúng ta sẽ dự báo giá trị, x là biến độc lập (biến tác động lên biến phụ thuộc), β0 là giá trị ước lượng của p khi x đạt giá trị 0 (Intercept), βp dùng để xác định giá trị trung bình của p tăng hay giảm khi xp tăng.

Chúng ta có các biến cần xét:

  • Biến mục tiêu: là biến Target, có giá trị 0, 1 với 0 là chiến dịch không đạt mục tiêu, 1 là chiến dịch đạt mục tiêu.
  • Các biến đầu vào: biến Objectives, Audience, Cost, Lifetime, Idea, Content. Là 6 yếu tố công ty có thể thay đổi.

Đầu tiên là coding các biến định tính

Bước làm này giống tạo biến giả cho các biến định tính ở hồi quy tuyến tính.

Kết quả của hồi quy Logistics

Nói một chút về kết quả mô hình, về hệ số R2Cox Snell chỉ đạt 26.6%, tức chỉ có 26.6% trong số các biến độc lập có thể giải thích được sự thay đổi trong xác suất của biến mục tiêu, dự báo khả năng chiến dịch có thành công hay không. Con số này chỉ ở mức tương đối, có thể cải thiện được.

Kết quả kiểm định Hosmer & Lemeshow test cho thấy P-value > 0.05 tức mô hình phù hợp để dự báo chính xác khả năng chiến dịch có thành công hay không.

Độ chính xác của mô hình trong việc phân loại chiến dịch nào sẽ thành công dựa trên các biến đầu vào là 82.6%..

Để hiểu hơn về các phương pháp đánh giá các bạn xem lại các bài viết logistic regression

Dưới đây là kết quả hệ số hồi quy:

Cũng giống ở hồi quy tuyến tính, để đánh giá liệu có thực sự có mối quan hệ giữa biến đầu vào và biến mục tiêu chúng ta cũng dựa trên giá trị tại cột sig, là giá trị P-value kiểm định của hệ số hồi quy.

Ở các biến giả Audience đều có p-value > 0.05 nên không có ý nghĩa thống kê để phân tích, tương tự biến Idea. Chúng ta loại bỏ 2 biến này ra khỏi mô hình hoặc sử dụng phương pháp Forward Stepwise (Wald)

Dưới đây là kết quả tối ưu sau cùng của SPSS:

Kết quả mô hình, chúng ta nhìn ở Step 2, bước cuối cùng để có mô hình, các chỉ số đều đạt yêu cầu. riêng hệ số R2 Cox & Snell có giảm một chút so với ban đầu. Nhưng nhìn vào các biến và cột Sig, chúng ta thấy có điểm khả quan hơn.

Phương trình tổng quát được viết lại như sau:

E(y) = P = (e3.006 +  (-0.009)*cost + 1.589*ObVideoviews – 0.849*ObReach + 1.670*ObPurchases + 0.528*ObMessages + 0.278*ObEngagement) )/ [1 + e3.006 +  (-0.009)*cost + 1.589*ObVideoviews – 0.849*ObReach + 1.670*ObPurchases + 0.528*ObMessages + 0.278*ObEngagement) ]

Mặc dù thông qua phân tích ban đầu chúng ta có thể thấy nếu chạy chiến dịch Reach thì khả năng chiến dịch đạt target sẽ cao, nhưng thực chất không phải, nếu xét trong mô hình hồi quy Logistic này và khi kết hợp với yếu tố chi phí.

Giả sử công ty cho chạy chiến dịch reach, với cost là 1000 USD, chúng ta có

E(Y) = P = (e3.006 +  (-0.009)*1000 + 1.589*0 – 0.849*1 + 1.670*0 + 0.528*0 + 0.278*0) )/ [1 + (e3.006 +  (-0.009)*1000 + 1.589*0 – 0.849*1 + 1.670*0 + 0.528*0 + 0.278*0) )

E(Y) chỉ bằng 0.1 %, tức xác suất để chiến dịch này đạt target là 0.1%. Điều này khá vô lý trong thực tế khi chúng ta tăng chi phí chạy quảng cáo, thì lượt tiếp cận sẽ tăng, và cơ hội tăng sales cũng sẽ có, trừ trường hợp nội dung sáng tạo không đạt yêu cầu, cách target khách hàng sai, các yếu tố bên ngoài này tác động vô thêm.

Như vậy, câu hỏi đặt ra cho các bạn liệu trong thực tế mình có thể dự báo được thành công của một chiến dịch quảng cáo Facebook hay không? Nếu được thì trong các biến đầu vào chúng tôi kể ở trên, các bạn nghĩ chúng ta cần bổ sung thêm biến nào khi các biến hiện rất ít ỏi?

Về chúng tôi, công ty BigDataUni với chuyên môn và kinh nghiệm trong lĩnh vực khai thác dữ liệu sẵn sàng hỗ trợ các công ty đối tác trong việc xây dựng và quản lý hệ thống dữ liệu một cách hợp lý, tối ưu nhất để hỗ trợ cho việc phân tích, khai thác dữ liệu và đưa ra các giải pháp. Các dịch vụ của chúng tôi bao gồm “Tư vấn và xây dựng hệ thống dữ liệu”, “Khai thác dữ liệu dựa trên các mô hình thuật toán”, “Xây dựng các chiến lược phát triển thị trường, chiến lược cạnh tranh”.

Mục nhập này đã được đăng trong BLOG. Đánh dấu trang permalink.
error: Content is protected !!