Mục lục nội dung:
I – Giới thiệu
Ngành hàng tiêu dùng nhanh (FMCG) là một trong những ngành quan trọng với tốc độ tiêu thụ cao và nhu cầu liên tục. Để duy trì và nâng cao vị thế trong thị trường, việc áp dụng khoa học dữ liệu trở thành yếu tố then chốt cho các doanh nghiệp/cá nhân hoạt động kinh doanh trong FMCG. Khoa học dữ liệu giúp các doanh nghiệp FMCG hiểu rõ hơn về thị trường, tối ưu hóa quy trình kinh doanh và đáp ứng nhu cầu khách hàng một cách hiệu quả.
Mục tiêu của bài viết này là đưa ra một giải pháp kỹ thuật phân tích không gian kết hợp với các kỹ thuật học máy để lập bản đồ ước tính tiềm năng thị trường cho ngành FMCG. Bài viết sẽ cung cấp thông tin chi tiết và trực quan hóa không gian về tiềm năng thị trường ngành FMCG, giúp doanh nghiệp FMCG đưa ra quyết định chiến lược để tối ưu hóa hoạt động sản xuất và kinh doanh sản phẩm.
II – Phương pháp tiếp cận
Trong phân tích không gian, việc sử dụng các điểm chính xác có thể mang lại kết quả tốt. Tuy nhiên, việc thu thập dữ liệu điểm đầy đủ và chính xác thường là một vấn đề lớn, vì một số dữ liệu có thể khó thu thập (như cửa hàng tạp hóa, doanh thu cửa hàng, thị phần sản phẩm, …). Ngoài ra, việc phân tích để xác định tiềm năng thị trường FMCG còn phụ thuộc vào nhiều yếu tố như môi trường, định hướng kinh doanh của doanh nghiệp, … các yếu tố khó có thể xây dựng.
Để thực hiện “Lập bản đồ Ước tính tiềm năng thị trường ngành FMCG,” bài viết tập trung vào các yếu tố sau:
1) Hệ số giao thông: Bao gồm loại mạng lưới giao thông và giao thông công cộng.
2) Số lượng cơ sở POI (điểm ưa thích): Chẳng hạn như trường học, bệnh viện, khách sạn, v.v.
3) Các yếu tố cạnh tranh: Chủ yếu là các cửa hàng FMCG hiện có như siêu thị mini, cửa hàng tiện lợi, cửa hàng tạp hóa.
4) Ước tính số lượng khách hàng tiềm năng.
Có hai phương pháp tiếp cận để xác định quy mô thị trường:
- Cách tiếp cận Bottom-Up: Bắt đầu từ khách hàng của doanh nghiệp. Xác định số lượng khách hàng tiềm năng dựa trên hồ sơ khách hàng và khả năng tiếp cận họ.
- Cách tiếp cận Top-Down: Bắt đầu với dữ liệu thị trường và ngành. Xem xét khu vực thị trường địa lý và lập hồ sơ người tiêu dùng/doanh nghiệp để biết xu hướng mua sản phẩm và dịch vụ.
Phân tích không gian trong bài toán này sẽ sử dụng bản đồ raster với các ô hình vuông (grid) hoặc hình lục giác (hexagon), mỗi ô có các thông tin về mật độ POI, sức chi tiêu, tập khách hàng tiềm năng, mật độ đối thủ cạnh tranh, sự tiện nghi về hạ tầng giao thông, hạ tầng tiện ích, v.v. Kỹ thuật học máy sẽ được sử dụng để xác định chỉ số tiềm năng thị trường ngành FMCG.
III – Đánh giá đặc trưng dữ liệu
Có rất nhiều yếu tố quyết định đến việc xác định tiềm năng thị trường, tuy nhiên trong phạm vi nghiên cứu và đánh gía của bài viết này, chúng tôi xác định một số đặc trưng, dữ liệu đầu vào có thể quyết định đến việc xác định tiềm năng thị trường như sau:
- Dữ liệu dân số
- Mật độ dân số
- Tỷ lệ tăng trưởng dân số hàng năm
- Tỷ lệ di cư hàng năm (đến và đi)
- Cơ cấu tuổi tác và giới tính
- Thu nhập và mức sống
- Thu nhập bình quân
- Mức độ chi tiêu cho ngành FMCG
- Hạ tầng tiện tích và giao thông
- Hệ thống giao thông, hạ tầng công cộng
- Hệ thống thương mại gồm các siêu thị và trung tâm thương mại
- Hệ thống các điểm quan tâm (POI) chẳng hạn như trường học, bệnh viện, nhà cao tầng, trụ sở cơ quan, khách sạn, …
- Hành vi tiêu dùng
- Thói quen mua sắm
- Xu hướng, sở thích tiêu dùng
- Cạnh tranh
- Mật độ đối thủ cạnh tranh ngành FMCG (cửa hàng tạp hóa, siêu thị mini, …)
- Thị phần hiện tại của đối thủ ngành FMCG
- Môi trường kinh doanh
- Tiềm năng phát triển lâu dài như thông tin quy hoạch đô thị, quy hoạch khu công nghiệp, quy hoạch hạ tầng giao thông; kế hoạch phát triển kinh tế mũi nhọn, các khu vực ưu tiên phát triển; …
IV – Phương pháp và các bước thực hiện đề xuất
1. Tổng quan các quy trình thực hiện
- Thu thập đầy đủ các yêu cầu dữ liệu
- Sử dụng các phương pháp nội suy dữ liệu không gian để xây dựng các chỉ số tương ứng với từng loại dữ liệu (mỗi một loại dữ liệu được gán tương ứng với một chỉ số)
- Chuẩn hóa các chỉ số để đưa về một thang đo tiêu chuẩn (giả sử thang đo từ 0-1): Có thể áp dụng phương pháp Chuẩn hóa Min-Max hoặc Chuẩn hóa Z-score để đưa về một thang đo
- Sử dụng các phương pháp học máy hoặc tối ưu toán học để tính toán và đánh giá chỉ số cho bản đồ tiềm năng thị trường ngành FMCG – chỉ số thể hiện tiềm năng thị trường ngành FMCG
Việc quan trọng là cần xác định các chỉ số và trọng số tương ứng mà nó có thể ảnh hưởng đến tiềm năng thị trường ngành FMCG, giả định rằng có các chỉ số kèm theo trọng số tương ứng ở bảng dưới đây có ảnh hưởng đến tiềm năng thị trường FMCG:
Nhóm | Chỉ số | Mô tả | Trọng số |
Nhân khẩu học | Tổng dân số | Tổng dân số dân số thể hiện tổng KH tiềm năng trong mỗi ô lưới 100×100, sử dụng nguồn WorldPop | 20 |
Cơ cấu theo độ tuổi | Tập khách hàng tiềm năng nhất cho ngành FMCG thường là khách hàng nằm trong khoảng tuổi từ 5-49, sử dụng nguồn WorldPop để xây dựng | 25 | |
Thu nhập bình quân | Thu nhập bình quân đầu người ảnh hưởng đến mức khả năng chi trả cho tiêu dùng của người dân, thể hiện trong từng ô lưới 100×100 | 10 | |
Chi tiêu cho hàng tiêu dùng | Mức chi tiêu hàng tiêu dùng bình quân cho hàng hóa FMCG, thể hiện giá trị trong từng ô lưới 100×100 | 25 | |
POI | Khả năng tiếp cận cơ sở giáo dục (trường học các cấp, trung tâm giáo dục) | Chỉ số về khả năng tiếp cận theo đường giao thông đường bộ của các cơ sở giáo dục. Khả năng tiếp cận tốt thì tiềm năng càng cao | 15 |
Khả năng tiếp cận cơ sở y tế | Chỉ số về khả năng tiếp cận theo đường giao thông đường bộ của các cơ sở y tế, khả năng tiếp cận tốt thì tiềm năng càng cao | 15 | |
Khả năng tiếp cận Siêu thị lớn và TTTM | Chỉ số về khả năng tiếp cận theo đường giao thông đường bộ của các siêu thị lớn và TTTM, khả năng tiếp cận tốt thì tiềm năng cao | 10 | |
Hạ tầng & giao thông | Khả năng tiếp cận mạng lưới giao thông đường bộ | Chỉ số về khả năng tiếp cận mạng lưới giao thông đường bộ, càng gần đường giao thông tin tiềm năng càng cao | 20 |
Khả năng tiếp cận các điểm giao thông công cộng | Chỉ số về khả năng tiếp cận đường giao thông đường bộ đến các điểm giao thông công cộng như điểm xe bus, tàu điện, … | 10 | |
Cạnh tranh | Khả năng tiếp cận tới cửa hàng cạnh tranh (siêu thị mini, cửa hàng tạp hóa, cửa hàng tiện lợi) | Khả năng tiếp cận mạng lưới giao thông của các đối thủ cạnh tranh để ước tính ra chỉ số cạnh tranh, các khu vực càng gần đối thủ cạnh tranh thì tiềm năng càng thấp | -50 |
Tỷ lệ thị phần đối thủ | Tỷ lệ thị phần của đối thủ, tỷ lệ thị phần càng thấp thì tiềm năng càng cao | 5 |
2. Chi tiết từng quy trình thực hiện
2.1. Thu thập số liệu
Các dữ liệu được đánh giá là khả thi trong việc thu thập ở giai đoạn này bao gồm:
- Dữ liệu dân số: Sử dụng nguồn WorldPop độ phân giải 100×100 (bao gồm dân số theo giới tính và các khoảng tuổi)
- Dữ liệu mạng lưới giao thông: Sử dụng dữ liệu mạng lưới giao thông nguồn mở OpenStreetMap
- Dữ liệu vị trí các điểm xe bus, điểm tàu điện, bến xe, bến tàu
- Dữ liệu vị trí các điểm POI (cơ sở giáo dục, cơ sở y tế, công viên, rạp chiếu phim, khu vui chơi, đại siêu thị, trung tâm thương mại)
- Dữ liệu vị trí các điểm bán hàng FMCG (siêu thị mini, cửa hàng tiện lợi)
Lưu ý quan trọng: Giai đoạn này chỉ thử nghiệm với dữ liệu vị trí (vị trí POI, vị trí POS), chưa có các dữ liệu khác như quy mô, phân loại, … các thông tin này nếu thu thập được thì sẽ gán trọng số cho vị trí để thể hiện mức độ quan trọng, không ảnh hưởng gì đến phương pháp và quy trình thực hiện
2.2. Xây dựng các chỉ số cho từng loại dữ liêu
Các phương pháp, kỹ thuật và kết quả dự kiến của việc xây dựng các chỉ số không gian cho từng loại dữ liệu:
Nhóm | Chỉ số | Mô tả tổng quan phương pháp | Kết quả dự kiến |
Nhân khẩu học | Tổng dân số | – Sử dụng nguồn WordPop với độ phân giải 100×100 năm 2020 | Bản đồ raster với các ô lưới độ phân giải 100×100, giá trị mỗi ô thể hiện tổng dân số |
Cơ cấu theo độ tuổi | – Sử dụng nguồn WordPop với độ phân giải 100×100 theo từng khoảng tuổi – Sử dụng GEE hoặc QGIS để tính toán tổng dân số theo độ tuổi tiềm năng từ 5-49 tuổi | Bản đồ raster với các ô lưới độ phân giải 100×100, giá trị mỗi ô thể hiện tổng dân số trong độ tuổi từ 5-49 tuổi | |
Thu nhập bình quân | – Nguồn dữ liệu dự kiến từ Tổng cục thống kê và các báo cáo thị trường của các công ty nghiên cứu thị trường, | Bản đồ raster với các ô lưới độ phân giải 100×100, giá trị mỗi ô thể hiện uớc tính thu nhập bình quân đầu người. | |
Chi tiêu cho hàng tiêu dùng | – Nguồn dữ liệu dự kiến từ Tổng cục thống kê và các báo cáo thị trường của các công ty khác | Bản đồ raster với các ô lưới độ phân giải 100×100, giá trị mỗi ô thể hiện uớc tính mức chi tiêu tiêu dùng bình quân | |
POI | Khả năng tiếp cận cơ sở giáo dục (trường học các cấp, trung tâm giáo dục, …) | – Sử dụng phương pháp Web Scraping thu thập dữ liệu cơ sở giáo dục từ Google Map, trang thống kê của sở giáo dục, bộ giáo dục – Sử dụng phương pháp Cumulative Cost Mapping trong GEE hoặc QGIS (phương pháp nội suy không gian) để ước lượng ra khả năng tiếp cận mạng lưới giao thông (lấy từ OSM) với các cơ sở giáo dục | Bản đồ raster, trong đó mỗi ô pixel thể hiện số thời gian di chuyển từ ô pixel đến cơ sở giáo dục gần nhất theo mạng lưới giao thông đường bộ. |
Khả năng tiếp cận cơ sở y tế | – Tương tự như cơ sở giáo dục nhưng thay thế bằng các cơ sở y tế. – Cơ sở y tế bao gồm: Trạm y tế, trung tâm y tế, phòng khám và bệnh viện – Cơ sở y tế được đánh trọng số từ 1-4 tương ứng với trạm y tế đến bệnh viện (trọng số càng cao thì thể hiện mức độ tiếp cận tốt hơn) | Bản đồ raster, trong đó mỗi ô pixel thể hiện số thời gian di chuyển từ ô pixel đến cơ sở y tế gần nhất theo mạng lưới giao thông đường bộ. | |
Khả năng tiếp cận Siêu thị lớn và TTTM | – Tương tự như cơ sở giáo dục nhưng thay thế bằng các siêu thị lớn và TTTM | Bản đồ raster, trong đó mỗi ô pixel thể hiện số thời gian di chuyển từ ô pixel đến Đại siêu thị hoặc TTTM gần nhất theo mạng lưới giao thông đường bộ. | |
Hạ tầng & Giao thông | Khả năng tiếp cận giao thông chính | – Sử dụng phương pháp Cumulative Cost Mapping trong GEE hoặc QGIS (phương pháp nội suy không gian) để ước lượng ra khả năng tiếp cận mạng lưới giao thông (lấy từ OSM) – Trọng số của đường giao thông được phân loại theo đường chính, được phụ, đường ngõ ngách | Bản đồ raster, trong đó mỗi ô pixel thể hiện số thời gian di chuyển từ ô pixel đến đường giao thông gần nhất theo mạng lưới giao thông đường bộ. |
Khả năng tiếp cận giao thông công cộng | – Sử dụng phương pháp Web Scraping thu thập dữ liệu điểm giao thông công cộng (điểm xe bus, bến xe, bến tầu, điểm tàu điện) từ Google Map, các trang thống kê về điểm xe bus – Sử dụng phương pháp Cumulative Cost Mapping trong GEE hoặc QGIS (phương pháp nội suy không gian) để ước lượng ra khả năng tiếp cận mạng lưới giao thông (lấy từ OSM) với các điểm giao thông công cộng | Bản đồ raster, trong đó mỗi ô pixel thể hiện số thời gian di chuyển từ ô pixel đến điểm giao thông công cộng gần nhất theo mạng lưới giao thông đường bộ. | |
Cạnh tranh | Khả năng tiếp cận tới cửa hàng cạnh tranh (siêu thị mini, cửa hàng tiện lợi) | – Sử dụng phương pháp Web Scraping thu thập dữ liệu điểm giao thông công cộng (điểm xe bus, bến xe, bến tầu, điểm tàu điện) từ Google Map, các trang thống kê về siêu thị mini, cửa hàng tiện lợi) – Sử dụng phương pháp Cumulative Cost Mapping trong GEE hoặc QGIS (phương pháp nội suy không gian) để ước lượng ra khả năng tiếp cận mạng lưới giao thông (lấy từ OSM) với các điểm giao thông công cộng | Bản đồ raster, trong đó mỗi ô pixel thể hiện số thời gian di chuyển từ ô pixel đến điểm cửa hàng cạnh tranh gần nhất theo mạng lưới giao thông đường bộ. |
Tỷ lệ thị phần đối thủ | – Chưa có phương pháp |
2.3. Chuẩn hóa các chỉ số cho từng loại dữ liệu
Các chỉ số cho từng loại dữ liệu đều thể hiện các giá trị và đơn vị cho từng mục đích khác nhau, ví dụ dân số là tổng số người định cư; khả năng tiếp cận là thời gian di chuyển, … Vì vậy cần phải chuẩn hóa về một thang đo để đánh giá tổng quát tiềm năng thị trường dựa trên các tiêu chí dữ liệu. Có thể sử dụng các phương pháp sau để chuẩn hóa về một thang đo chuẩn như: Min-Max Scaling, Z-score Standardization, Robust Scaling. Trong bài toán này chúng tôi sử dụng Z-score Standardization
2.4. Kết quả dự kiến
Sử dụng các phương pháp học máy (hồi quy hoặc nội suy) để tính toán mối tương quan giữa các đặc trưng đầu vào với chỉ số tiềm năng thị trường ngành FMCG – chỉ số thể hiện tiềm năng thị trường ngành FMCG
(Kết quả thể hiện mức độ tiềm năng thị trường là các khu vực màu xanh, khu vực thử nghiệm thuộc Quận Bắc Từ Liêm – Hà Nội. Kết quả có thể không phản ánh đúng thực tế do yếu tố đầu vào dữ liệu chỉ là thử nghiệm)
Kết quả đầu ra dự kiến là “bản đồ raster thể hiện tiềm năng thị trường cho ngành FMCG” với thông tin là các chỉ số liên quan như:
- các chỉ số về dân số
- các chỉ số về hạ tầng giao thông
- các chỉ số về cạnh tranh
- các chỉ số về điểm POI
- chỉ số tiềm năng thị trường FMCG
2.5. Đánh giá kết quả
Với cách tiếp cận như đã mô tả ở trên, có thể áp dụng một số phương pháp/mô hình để đánh giá sự tương quan của các chỉ số đó:
- Phân tích hồi quy
- Phân tích PCA
- Phân tích dựa trên chuyên gia
- Phân tích Analytic Hierarchy Process – AHP
- Phân tích tỷ lệ (Ratio Analysis)
Tuy nhiên, theo đánh giá của chúng tôi, chọn phương pháp AHP được áp dụng trong bài toán này là phù hợp vì các lý do sau:
- Tính hệ thống và khoa học: AHP cung cấp một cách tiếp cận có hệ thống và khoa học để xác định trọng số thông qua so sánh cặp.
- Đơn giản và dễ hiểu: Phương pháp này dễ hiểu và dễ áp dụng, đặc biệt khi bạn có sự tham gia của các chuyên gia.
- Giải thích tường minh: AHP cho phép bạn dễ dàng giải thích quá trình xác định trọng số, giúp các bên liên quan dễ hiểu và chấp nhận kết quả.
- Phù hợp với dữ liệu hạn chế: Khi không có dữ liệu thực tế, AHP dựa vào sự đánh giá chủ quan từ các chuyên gia, do đó phù hợp với tình huống hiện tại.
V – Kết luận
1. Lợi ích mang lại khi xác định được tiềm năng thị trường
Với việc xác định và trực quan hóa các khu vực tiềm năng thị trường ngành FMCG từ kết quả ở trên, nó sẽ là cơ sở cho doanh nghiệp hay cá nhân có thể phân tích và đánh giá:
- Làm cơ sở để phân cụm khách hàng tiềm năng
- Làm cơ sở để đánh giá độ phủ của các điểm bán hàng dựa trên khả năng bao phủ điểm bán của doanh nghiệp và quy mô thị trường ước tính
- Làm cơ sở để tìm các khu vực thị trường tiềm năng để phát triển mở rộng
- Làm cơ sở để lập kế hoạch ước tính doanh thu của các điểm bán, nhà phân phối
- Làm cơ sở để dự đoán nhu cầu đặt hàng của khách hàng theo thị trường
- Làm cơ sở để tính KPI cho nhân viên, điểm bán hàng, nhà phân phối
- Làm cơ sở để lập kế hoạch tồn kho cho sản phẩm
2. Vấn đề và thách thức
- Chất lượng dữ liệu đầu vào, và các giả định ban đầu có thể ảnh hưởng đến kết quả
- Số lượng biến số (loại dữ liệu) đầu vào có thể không đủ cơ sở để xác định chỉ số tiềm năng thị trường
- Độ tin cậy của dữ liệu có thể ảnh hưởng
- Với phương pháp tiếp cận Top-Down thì độ chính xác có thể không cao vì phụ thuộc nhiều vào dữ liệu, các ước tính và giả định ban đầu
- Vì vậy để nâng cao độ chính xác cần xem xét kết hợp với phương pháp tiếp cận Bottom-Up, tức là kết hợp phân tích tiềm năng thị trường từ dữ liệu kinh doanh của doanh nghiệp tại các điểm bán hay khu vực bán hàng để ước tính ra tiềm năng thị trường tổng thể tại các khu vực khác nhau. Tuy nhiên, để áp dụng được phương pháp này yêu cầu cần dữ liệu chi tiết về bán hàng của doanh nghiệp như lịch sử bán hàng, doanh thu, số lượng khách hàng, ….