Dự báo nhu cầu và bán hàng có tầm quan trọng tối cao trong bán lẻ. Nếu không có công cụ này, các công ty gặp phải sự gián đoạn của số dư hàng tồn kho, thông qua việc đặt hàng quá nhiều hoặc không đủ sản phẩm trong một khoảng thời gian nhất định. Trong trường hợp thừa hàng, một công ty buộc phải giảm giá để bán sản phẩm. Nếu không, nó có thể phải đối mặt với vấn đề hàng tồn kho. Sự thiếu hụt, lần lượt, dẫn đến mất lợi nhuận. Tuy nhiên, những vấn đề này có thể được giải quyết bằng cách áp dụng dự báo nhu cầu và bán hàng để tăng lợi nhuận trên hàng tồn kho và xác định ý định của người tiêu dùng trong tương lai để mua một sản phẩm cụ thể ở một mức giá cụ thể.
Chúng ta hãy cùng nhau trải qua quá trình triển khai ML forecasting trong bán lẻ, khám phá các bước chính của việc xây dựng phần mềm dự báo.
Lợi ích của dự báo nhu cầu ML đối với doanh nghiệp
Sự không chắc chắn và những thay đổi trên thị trường dẫn đến dữ liệu biến động cao. Không giống như các phương pháp truyền thống, dự báo nhu cầu sử dụng Học Máy (Machine Learning) linh hoạt hơn và cho phép truyền nhanh thông tin mới vào các mô hình. Đó là lý do tại sao các mô hình ML đủ thích ứng và chính xác để mang lại lợi ích rõ ràng cho doanh nghiệp:
- Tăng doanh số bán hàng. Tất cả các sản phẩm cần thiết sẽ có sẵn trong cửa hàng, vì vậy khách hàng có thể mua chúng mà không cần chờ đợi thời gian giao hàng lâu.
- Duy trì sự hài lòng của khách hàng. Các nhà kho sẽ lên kế hoạch mua hàng trước, vì vậy khách hàng sẽ không phải đối mặt với vấn đề vắng mặt sản phẩm yêu thích của họ.
- Vòng quay hàng tồn kho cao hơn. Nhờ lập kế hoạch hàng hóa hợp lý trong kho, hàng hóa bán kém sẽ không bị cũ.
- Giảm số lượng sản phẩm hư hỏng. Dự báo nhu cầu sẽ giúp lập kế hoạch phân phối sản phẩm một cách thành thạo, xem xét ngày hết hạn.
- Giảm chi phí nhân sự. Bằng cách phân tích và dự đoán nhu cầu trong tương lai, chúng tôi có thể lập kế hoạch số lượng nhân viên tối ưu để hỗ trợ ca làm việc phù hợp.
Các phương pháp dự báo nhu cầu ML, giống như các Case study khác của dự báo Học Máy (Machine Learning), có thể dựa vào một lượng dữ liệu khổng lồ để đưa ra dự đoán chính xác. Tuy nhiên, câu hỏi làm thế nào để phát triển các mô hình như vậy vẫn còn bỏ ngỏ và chúng tôi sẽ xem xét nó trong phần sau.
Phương pháp dự báo truyền thống
Để hiểu tại sao Học Máy (Machine Learning) lại tốt hơn cho việc dự báo, trước tiên chúng ta hãy xem xét một số phương pháp dự báo chuỗi thời gian truyền thống, như đường trung bình động, làm mịn theo cấp số nhân và ARIMA.
Đường trung bình động
Đường trung bình động là một cách làm mịn dữ liệu bằng cách tính trung bình có trọng số của các giá trị trong quá khứ. Điều này có thể hữu ích để loại bỏ tiếng ồn từ dữ liệu và xác định xu hướng. Tuy nhiên, nó cũng có thể dễ bị ngoại lệ và không thể tính đến tính thời vụ.
Giả sử chúng ta có dữ liệu bán hàng trong khoảng thời gian 5 năm:
- 2017: 3 triệu USD
- 2018: 6 triệu USD
- 2019: 7 triệu USD
- 2020: 8 triệu USD
- 2021: 11 triệu USD
Dự báo cho năm 2022 là 7.2 triệu đô la, bắt nguồn từ mức trung bình đơn giản của năm năm qua. Tuy nhiên, điều này không tính đến thực tế là doanh số bán hàng đang tăng lên mỗi năm.
Đường trung bình động thường được sử dụng để làm mịn chuỗi dữ liệu. Có một số loại đường trung bình động khác nhau, bao gồm:
- Đường trung bình động đơn giản (SMA)
- Đường trung bình động mượt mà (SMMA)
- Đường trung bình động có trọng số (WMA)
- Đường trung bình động hàm mũ (EMA)
Loại đường trung bình động cơ bản nhất là Đường trung bình động đơn giản (SMA), được tính bằng cách lấy giá trị trung bình của một số điểm dữ liệu nhất định, quá khứ và hiện tại. Đường trung bình động có trọng số (WMA) tính đến tầm quan trọng tương đối của từng điểm dữ liệu, bằng cách gắn nhiều giá trị hơn vào các điểm dữ liệu gần đây.
Chúng thường được sử dụng trong thị trường tài chính để làm dịu biến động giá và có được bức tranh rõ ràng hơn về xu hướng.
7 lý do tại sao ML để dự báo tốt hơn các phương pháp truyền thống
Chúng ta hãy xem xét bảy lý do tại sao Học Máy (Machine Learning) là một công cụ dự đoán tốt hơn các phương pháp truyền thống.
1. Học Máy (Machine Learning) có thể xác định các mẫu quá phức tạp để con người có thể quan sát.
Một trong những lợi thế chính của Học Máy (Machine Learning) là nó có thể xác định các mẫu quá phức tạp để con người quan sát. Các phương pháp dự báo truyền thống bị giới hạn bởi lượng dữ liệu có thể được xử lý và phân tích bởi con người.
Ví dụ, giả sử chúng ta muốn dự báo giá thị trường chứng khoán. Các phương pháp truyền thống sẽ dựa vào các nhà phân tích để xác định các mô hình trên thị trường và đưa ra dự đoán dựa trên nghiên cứu. Tuy nhiên, con người thường khó xác định tất cả các yếu tố ảnh hưởng đến giá cổ phiếu. Học Máy (Machine Learning) có thể phân tích một lượng lớn dữ liệu rất nhanh và xác định các mẫu mà con người không nhìn thấy được. Điều này có thể dẫn đến dự đoán chính xác hơn so với các phương pháp truyền thống.
Renaissance Technologies đã sử dụng Học Máy (Machine Learning) để đạt hiệu quả lớn trong lĩnh vực này. Công ty đã phát triển các thuật toán Học Máy (Machine Learning) đã đạt được hơn 70% lợi nhuận hàng năm kể từ khi thành lập vào năm 1994.
2. Học Máy (Machine Learning) có thể đưa ra dự đoán dựa trên tập dữ liệu lớn hơn nhiều so với các phương pháp truyền thống.
Học Máy (Machine Learning) cũng có thể đưa ra dự đoán dựa trên tập dữ liệu lớn hơn nhiều so với các phương pháp truyền thống.
Hãy xem xét vấn đề dự báo doanh số. Một phương pháp truyền thống như phân tích xu hướng chỉ có thể xem xét dữ liệu bán hàng trong quá khứ để đưa ra dự báo. Mặt khác, Học Máy (Machine Learning) có thể phân tích dữ liệu từ phương tiện truyền thông xã hội, đánh giá của khách hàng và các nguồn khác để đưa ra dự đoán chính xác hơn.
Ngoài dữ liệu chuỗi thời gian, các mô hình Học Máy (Machine Learning) có thể tính đến dữ liệu chuỗi cung ứng và các số liệu thực tế khác, cho phép dự báo nhu cầu chính xác hơn. Dự báo chuỗi thời gian truyền thống thiếu sót khi nói đến dữ liệu lớn.
3. Học Máy (Machine Learning) không thiên vị bởi cảm xúc của con người hoặc ý kiến chủ quan.
Một trong những nhược điểm lớn nhất của các phương pháp dự báo truyền thống là chúng bị thiên vị bởi cảm xúc của con người và ý kiến chủ quan. Điều này có thể dẫn đến những dự đoán không chính xác, vì con người thường bị ảnh hưởng bởi những thành kiến và cảm xúc cá nhân của họ. Học Máy (Machine Learning) không bị thiên vị bởi cảm xúc của con người hoặc ý kiến chủ quan, dẫn đến dự đoán chính xác hơn.
Hãy xem xét ví dụ về một công ty đang xem xét mở một cửa hàng mới. Các phương pháp dự báo truyền thống có thể bị thiên vị bởi những thành kiến cá nhân của những người thực hiện dự báo. Ví dụ, họ có thể có nhiều khả năng dự đoán rằng cửa hàng sẽ thành công nếu họ đầu tư cá nhân vào nó, bất kể bằng chứng. Mặt khác, Học Máy (Machine Learning) sẽ không bị ảnh hưởng bởi những thành kiến cá nhân này và sẽ đưa ra dự đoán chính xác hơn.
Tất nhiên, các mô hình ML cũng có thể bị sai lệch, nếu dữ liệu được sử dụng để đào tạo các mô hình có độ lệch. Tuy nhiên, sau khi đảm bảo rằng bạn đang sử dụng dữ liệu không thiên vị, bạn có thể dựa vào xác thực chéo để thông báo cho bạn nếu mô hình bạn đang xây dựng là chính xác.
4. Học Máy (Machine Learning) có thể thích ứng với những thay đổi một cách nhanh chóng
Học Máy (Machine Learning) cũng có thể thích ứng với những thay đổi trong tập dữ liệu, trong khi các phương pháp truyền thống có thể trở nên kém chính xác hơn theo thời gian. Khi tập dữ liệu thay đổi, Học Máy (Machine Learning) sẽ điều chỉnh các dự đoán của nó cho phù hợp. Điều này đảm bảo rằng các dự đoán luôn chính xác và cập nhật. Mặt khác, các phương pháp truyền thống có thể trở nên kém chính xác hơn theo thời gian khi tập dữ liệu thay đổi.
Ví dụ: giả sử bạn có một tập dữ liệu bao gồm dữ liệu mua hàng của khách hàng. Theo thời gian, khách hàng trong tập dữ liệu này có thể thay đổi. Cách tiếp cận truyền thống sẽ là xây dựng lại dự báo với bộ dữ liệu mới, sau đó sẽ tạo ra các dự đoán mới. Tuy nhiên, nếu bạn sử dụng máy học, mô hình có thể tự động thích ứng với tập dữ liệu mới.
5. Học Máy (Machine Learning) không dễ thao tác như các phương pháp truyền thống.
Học Máy (Machine Learning) cũng ít bị thao tác hơn so với các phương pháp truyền thống. Vì Học Máy (Machine Learning) dựa vào các thuật toán để đưa ra dự đoán, việc thao tác các dự đoán khó khăn hơn nhiều so với thao tác các dự đoán được thực hiện bằng các phương pháp truyền thống. Điều này dẫn đến dự đoán chính xác hơn.
6. Học Máy (Machine Learning) là cách sử dụng tài nguyên hiệu quả hơn
Học Máy (Machine Learning) là cách sử dụng tài nguyên hiệu quả hơn các phương pháp truyền thống. Các phương pháp truyền thống thường đòi hỏi rất nhiều công việc thủ công, có thể tốn thời gian và tốn kém. Giám đốc điều hành hiện đại hiểu rằng để duy trì tính cạnh tranh, họ cần tập trung vào việc tận dụng công nghệ để có lợi thế cạnh tranh. Học Máy (Machine Learning) có thể tự động hóa quá trình đưa ra dự đoán, đây là cách sử dụng tài nguyên hiệu quả hơn.
7. Học Máy (Machine Learning) dễ tiếp cận hơn các phương pháp truyền thống
Học Máy (Machine Learning) cũng dễ tiếp cận hơn các phương pháp truyền thống. Các phương pháp truyền thống thường đòi hỏi kiến thức và đào tạo chuyên ngành. Mặt khác, Học Máy (Machine Learning) đang trở nên dễ tiếp cận hơn khi công nghệ tiến bộ. Hiện nay có nhiều nền tảng phần mềm cho phép mọi người xây dựng các mô hình Học Máy (Machine Learning) mà không cần bất kỳ kiến thức hoặc kinh nghiệm nào trước đó.
Dự báo Học Máy (Machine Learning) hoạt động như thế nào?
Có bốn bước chính trong quy trình dự báo Học Máy (Machine Learning): thu thập dữ liệu, tiền xử lý dữ liệu, đào tạo mô hình và đánh giá mô hình.
Đương nhiên, bước đầu tiên là thu thập dữ liệu, vì dữ liệu cung cấp nhiên liệu cho tất cả các mô hình Học Máy (Machine Learning). Khai thác dữ liệu đề cập đến quá trình thu thập và phân tích dữ liệu lịch sử từ nhiều nguồn khác nhau, cho dù đó là quét web, trích xuất thông tin từ các biểu mẫu hay chỉ các trang tính Excel có liên quan. Các mô hình chuỗi thời gian rất kén chọn định dạng dữ liệu, vì vậy cần phải có “các bước thời gian” rõ ràng trong dữ liệu.
Quá trình tiền xử lý dữ liệu làm sạch và chuẩn bị dữ liệu để sử dụng trong thuật toán Học Máy (Machine Learning). Bước này bao gồm những việc như xóa dữ liệu nhiễu, chuẩn hóa dữ liệu, kỹ thuật tính năng và chuyển đổi dữ liệu thành định dạng mà thuật toán có thể hiểu được. Ngay cả các phương pháp thống kê truyền thống cũng yêu cầu xử lý trước dữ liệu.
Theo truyền thống, tài năng kỹ thuật là cần thiết để thực hiện tiền xử lý dữ liệu bằng các công cụ như Python. Tuy nhiên, với sự ra đời của các nền tảng tự phục vụ như Akkio, người dùng doanh nghiệp giờ đây có thể dễ dàng dọn dẹp và chuẩn bị dữ liệu của họ mà không cần sự trợ giúp từ CNTT. Điều này đã làm tăng việc áp dụng dự báo Học Máy (Machine Learning) trong môi trường kinh doanh.
Khi dữ liệu đã sẵn sàng, thuật toán Học Máy (Machine Learning) được đào tạo trên đó. Điều này liên quan đến việc chọn một loại mô hình và cấu hình các tham số của nó. Khi mô hình được đào tạo, nó được đưa vào sử dụng bằng cách dự báo các sự kiện trong tương lai. Hiệu suất của mô hình sau đó được đánh giá bằng cách so sánh các dự đoán của nó với kết quả thực tế.
Akkio xây dựng một số mô hình Học Máy (Machine Learning) trong nền cho bất kỳ vấn đề nhất định nào để tối đa hóa độ chính xác. Tùy thuộc vào tập dữ liệu, điều này bao gồm cây quyết định, mô hình ARIMA, mạng bộ nhớ ngắn hạn dài, mạng thần kinh tái phát (RNN), LSTM và các kỹ thuật học sâu khác. Các kỹ thuật tối ưu hóa khác nhau được triển khai trên các phương pháp Học Máy (Machine Learning) này, cho phép độ chính xác cao hơn so với khi chỉ sử dụng một mô hình.
Trong lịch sử, các công ty sẽ phải thuê các nhà khoa học dữ liệu sử dụng các công cụ như TensorFlow và Keras để xây dựng các mô hình này, nhưng bây giờ bất kỳ chuyên gia kinh doanh phi kỹ thuật nào cũng có thể xây dựng và triển khai các mô hình chỉ bằng một cú nhấp chuột. Các chuyên gia khoa học dữ liệu cũng có thể hưởng lợi từ phương pháp của Akkio với thử nghiệm và triển khai nhanh hơn.
Một khi vấn đề vượt ra ngoài các vấn đề đơn biến và phi tuyến, sức mạnh của Akkio thực sự tỏa sáng: Bất kỳ ai cũng có thể xây dựng các mô hình học tập có giám sát rất phức tạp trong giây lát.
Giả sử chúng ta muốn dự đoán doanh thu cho một công ty. Bước tiền xử lý dữ liệu sẽ liên quan đến việc loại bỏ bất kỳ dữ liệu nhiễu nào, chẳng hạn như lỗi trong dữ liệu bán hàng và chuẩn hóa dữ liệu để tất cả các giá trị có cùng tỷ lệ. Bước đào tạo mô hình sẽ liên quan đến việc tìm kiếm các mẫu trong dữ liệu để xây dựng một mô hình có thể dự đoán doanh thu trong tương lai. Bước đánh giá mô hình sẽ liên quan đến việc so sánh các dự đoán của mô hình với kết quả doanh thu thực tế.
Cách phát triển phần mềm dự báo nhu cầu dựa trên ML
Trước khi bắt tay vào phát triển mô hình dự báo nhu cầu, bạn nên hiểu quy trình làm việc của mô hình ML. Điều này cung cấp một lộ trình dựa trên dữ liệu về cách tối ưu hóa hợp tác với các nhà phát triển phần mềm. Hãy cùng điểm lại quy trình cách các kỹ sư AI tại MobiDev tiếp cận các nhiệm vụ dự báo nhu cầu ML.
BƯỚC 1. XEM XÉT DỮ LIỆU NGẮN GỌN
Bước đầu tiên khi bắt đầu dự án dự báo nhu cầu là cung cấp cho khách hàng những hiểu biết có ý nghĩa. Quá trình này bao gồm các bước sau:
- Thu thập dữ liệu có sẵn
- Xem xét ngắn gọn cấu trúc dữ liệu, độ chính xác và tính nhất quán
- Chạy một vài thử nghiệm dữ liệu và thí điểm
- Xem qua một bản tóm tắt thống kê
Theo kinh nghiệm của chúng tôi, một vài ngày là đủ để hiểu tình hình hiện tại và phác thảo các giải pháp khả thi.
BƯỚC 2. ĐẶT MỤC TIÊU KINH DOANH VÀ SỐ LIỆU THÀNH CÔNG
Mỗi dự án là duy nhất và có mục tiêu kinh doanh riêng. Do đó, giai đoạn này là chìa khóa trong việc tạo ra một giải pháp dự báo hiệu quả vì nó cung cấp điểm khởi đầu của quá trình phát triển và phác thảo các giai đoạn sau.
Trước khi đến giai đoạn phát triển giải pháp dự báo nhu cầu, nhóm phát triển phần mềm cần thống nhất với khách hàng / chủ doanh nghiệp về các chỉ số thành công để đánh giá kết quả của mô hình. Các chỉ số thành công cung cấp một định nghĩa rõ ràng về những gì là “có giá trị” trong dự báo nhu cầu. Một thông báo điển hình có thể nêu rõ:
“Tôi cần một giải pháp Học Máy (Machine Learning) dự đoán nhu cầu […] sản phẩm, cho [tuần / tháng / nửa năm / năm] tiếp theo, với […] % độ chính xác.”
Ví dụ về tuyên bố này sẽ giúp bạn xác định số liệu thành công của bạn sẽ như thế nào. Bạn phải xem xét các thông tin sau:
- Loại / Danh mục sản phẩm
Bạn sẽ dự báo những loại sản phẩm / danh mục sản phẩm nào?
Các sản phẩm / dịch vụ khác nhau nên được xem xét và dự đoán độc lập cho hầu hết các trường hợp. Ví dụ: dự báo nhu cầu cho các sản phẩm dễ hỏng và dịch vụ đăng ký đến cùng một thời điểm mỗi tháng có thể sẽ khác nhau.
- Khung thời gian
Khoảng thời gian dự báo nhu cầu là bao lâu?
Dự báo ngắn hạn thường được thực hiện dưới 12 tháng – 1 tuần/1 tháng/6 tháng.
Những dự báo này có thể có các mục đích sau:
- Cung cấp sản phẩm / dịch vụ liên tục
- Thiết lập mục tiêu bán hàng và đánh giá hiệu suất bán hàng
- Tối ưu hóa giá theo biến động thị trường và lạm phát
Dự báo dài hạn được hoàn thành trong khoảng thời gian dài hơn một năm. Các mục đích chính của dự báo dài hạn có thể bao gồm:
- Lập kế hoạch tài chính dài hạn và mua lại quỹ
- Ra quyết định liên quan đến việc mở rộng kinh doanh
- Hoạch định chiến lược hàng năm
- Chính xác
Tỷ lệ phần trăm dự kiến tối thiểu của độ chính xác dự báo nhu cầu để đưa ra quyết định sáng suốt là bao nhiêu?
Thực hiện các dự án phát triển phần mềm bán lẻ, chúng tôi đã có thể đạt được mức độ chính xác trung bình là 95,96% cho các vị trí có đủ dữ liệu. Mức độ chính xác dự báo bắt buộc tối thiểu được đặt tùy thuộc vào mục tiêu kinh doanh của bạn.
Ví dụ về các chỉ số để đo lường độ chính xác của dự báo là MAPE (Lỗi phần trăm tuyệt đối trung bình), MAE (Lỗi tuyệt đối trung bình) hoặc số liệu tùy chỉnh.
BƯỚC 3. HIỂU & CHUẨN BỊ DỮ LIỆU
Bất kể chúng tôi muốn dự đoán điều gì, chất lượng dữ liệu là một thành phần quan trọng trong dự báo nhu cầu chính xác. Các dữ liệu sau đây có thể được sử dụng để xây dựng các mô hình dự báo:
Khi xây dựng mô hình dự báo, dữ liệu được đánh giá theo các thông số sau:
- Tính nhất quán
- Chính xác
- Hiệu lực
- Liên quan
- Tiếp cận
- Đầy đủ
- Detalization
Trong thực tế, dữ liệu được thu thập bởi các công ty thường không lý tưởng. Nó thường cần được làm sạch, phân tích các khoảng trống và bất thường, kiểm tra mức độ liên quan và khôi phục. Đó là lý do tại sao các chuyên gia tư vấn khoa học dữ liệu có thể tham gia vào giai đoạn này.
Hiểu biết dữ liệu là nhiệm vụ tiếp theo sau khi chuẩn bị và cấu trúc hoàn tất. Nó chưa phải là mô hình hóa mà là một cách tuyệt vời để hiểu dữ liệu bằng cách trực quan hóa. Dưới đây bạn có thể thấy cách chúng tôi hình dung quá trình hiểu dữ liệu:
Hình ảnh trực quan này thể hiện sự phân tách dữ liệu, trích xuất xu hướng và các yếu tố theo mùa hoặc các yếu tố khác từ dữ liệu đầu vào. Nó được chia thành nhiều biểu đồ:
- Đồ thị thứ 1 là dòng thời gian gốc (trực quan hóa chuỗi thời gian)_
- Biểu đồ thứ 2, 3 và 4 thể hiện riêng tính thời vụ, xu hướng và tiếng ồn để phân tích và dự báo thêm
BƯỚC 4. PHÁT TRIỂN MÔ HÌNH Học Máy (Machine Learning)
Không có thuật toán dự báo “một kích thước phù hợp với tất cả”. Thông thường, các tính năng dự báo nhu cầu bao gồm một số phương pháp Học Máy (Machine Learning). Việc lựa chọn mô hình Học Máy (Machine Learning) phụ thuộc vào một số yếu tố, chẳng hạn như mục tiêu kinh doanh, loại dữ liệu, lượng và chất lượng dữ liệu, thời gian dự báo, v.v.
Tại đây, bạn sẽ tìm thấy những phương pháp Học Máy (Machine Learning) đó khi áp dụng cho các khách hàng bán lẻ của chúng tôi. Những cách tiếp cận này cũng có thể được sử dụng cho hầu hết các trường hợp dự báo nhu cầu:
- ARIMA/SARIMA
- Regression models
- XGBoost
- K-Nearest Neighbors Regression
- Random Forest
- Long Short-Term Memory (LSTM)
Dưới đây chúng tôi muốn mô tả chi tiết hơn 3 cách tiếp cận ML để làm việc với dữ liệu chuỗi thời gian cho các dự án dự báo nhu cầu thực.
PHƯƠNG PHÁP TIẾP CẬN CHUỖI THỜI GIAN
Chuỗi thời gian là một chuỗi các điểm dữ liệu được lấy tại các điểm liên tiếp, cách đều nhau trong thời gian. Các thành phần chính để phân tích bao gồm xu hướng, tính thời vụ, tính bất thường và tính chu kỳ.
Trong lĩnh vực bán lẻ, các mô hình chuỗi thời gian được áp dụng nhiều nhất như sau:
- Các mô hình ARIMA (đường trung bình động tích hợp tự hồi quy) nhằm mục đích mô tả các mối tương quan tự động trong dữ liệu chuỗi thời gian. Khi lập kế hoạch dự báo ngắn hạn, ARIMA có thể đưa ra dự đoán chính xác.
- Các mô hình SARIMA (Đường trung bình động tích hợp tự hồi quy theo mùa) là phần mở rộng của mô hình ARIMA hỗ trợ dữ liệu chuỗi thời gian đơn biến liên quan đến sự dịch chuyển ngược của giai đoạn theo mùa.
- Các mô hình Làm mịn theo cấp số nhân tạo ra các dự báo bằng cách sử dụng trung bình có trọng số của các quan sát trong quá khứ để dự đoán các giá trị mới. Bản chất của các mô hình này là kết hợp các thành phần Lỗi, Xu hướng và Theo mùa thành một phép tính trơn tru.
Bạn cũng có thể hiểu từ hình ảnh trực quan bên dưới về kết quả dự đoán thường trông như thế nào khi nói về việc làm việc với các phương pháp dự đoán chuỗi thời gian.
Giả sử bạn muốn dự báo nhu cầu về rau trong tháng tới. Đối với phương pháp tiếp cận chuỗi thời gian, bạn yêu cầu dữ liệu giao dịch bán hàng lịch sử trong ít nhất sáu tháng trước đó. Nếu bạn có dữ liệu lịch sử về các sản phẩm theo mùa – rau trong trường hợp của chúng tôi – sự lựa chọn tốt nhất sẽ là mô hình SARIMA. Sai số dự báo, trong trường hợp đó, có thể vào khoảng 10-15%.
MÔ HÌNH HỒI QUY
Mô hình hồi quy là một mô hình thống kê ước tính mối quan hệ giữa một biến phụ thuộc và một hoặc nhiều biến độc lập bằng cách sử dụng một dòng (hoặc một mặt phẳng trong trường hợp hai hoặc nhiều biến độc lập).
Các mô hình hồi quy cũng hữu ích trong việc dự đoán các giá trị tương lai từ các giá trị trong quá khứ. Họ có thể giúp xác định xu hướng cơ bản và đối phó với các trường hợp liên quan đến giá quá cao.
Mặc dù khá hiếm trong các trường hợp kinh doanh thực tế, chúng ta có thể thấy mối tương quan tuyến tính giữa tính năng mục tiêu cần được dự đoán và phần còn lại của các biến có sẵn. Do đó, điều quan trọng là chọn mô hình hồi quy thích hợp dựa trên dữ liệu của máy khách tùy chỉnh.
Một ví dụ trực quan về các mô hình hồi quy khác nhau được cung cấp dưới đây:
Hồi quy tuyến tính và đa thức với dữ liệu không thể tách tuyến tính
Giả sử bạn muốn tính toán nhu cầu về cà chua dựa trên chi phí của chúng. Giả sử cà chua phát triển vào mùa hè và giá thấp hơn vì số lượng cà chua cao, chỉ số nhu cầu sẽ tăng vào tháng Bảy và giảm vào tháng Mười Hai.
Thông tin cần thiết cho loại dự báo như vậy là dữ liệu giao dịch lịch sử, thông tin bổ sung về các sản phẩm cụ thể (trong trường hợp của chúng tôi là cà chua), giảm giá, chi phí thị trường trung bình, số lượng trong kho, v.v. Sai số dự báo có thể là 5-15%.
RỪNG NGẪU NHIÊN
Random Forest là một thuật toán Học Máy (Machine Learning) nổi tiếng, được thực hiện bằng cách xây dựng vô số cây quyết định tại thời điểm đào tạo và xuất ra dự đoán trung bình / trung bình (hồi quy) của từng cây.
Nó có thể được sử dụng cho cả vấn đề Phân loại và Hồi quy trong ML. Tuy nhiên, nó cũng có thể được sử dụng trong dự báo chuỗi thời gian, cả bộ dữ liệu đơn biến và đa biến bằng cách tạo các biến trễ và biến thành phần theo mùa theo cách thủ công.
Random Forest là cách tiếp cận tiên tiến hơn, lấy nhiều cây quyết định và hợp nhất chúng lại với nhau. Bằng cách lấy trung bình của tất cả các ước tính cây quyết định riêng lẻ, mô hình rừng ngẫu nhiên dẫn đến dự báo đáng tin cậy hơn.
Tuy nhiên, mặc dù tính linh hoạt của nó, Random Forest có một số hạn chế. Mô hình có thể quá chậm để dự đoán thời gian thực khi phân tích một số lượng lớn cây.
Nếu bạn không có thông tin nào khác ngoài dữ liệu số lượng về doanh số bán sản phẩm, phương pháp này có thể không có giá trị. Trong những trường hợp như vậy, cách tiếp cận chuỗi thời gian là vượt trội.
BƯỚC 5. ĐÀO TẠO &; TRIỂN KHAI
Đào tạo
Khi đào tạo các mô hình dự báo, các nhà khoa học dữ liệu thường sử dụng dữ liệu lịch sử. Bằng cách xử lý dữ liệu này, các thuật toán cung cấp (các) mô hình được đào tạo sẵn sàng sử dụng.
Xác nhận
Bước này đòi hỏi phải tối ưu hóa các thông số mô hình dự báo để đạt được hiệu suất cao. Bằng cách sử dụng phương pháp điều chỉnh xác thực chéo trong đó tập dữ liệu đào tạo được chia thành nhiều phần bằng nhau, các nhà khoa học dữ liệu đào tạo các mô hình dự báo với các bộ siêu tham số khác nhau. Mục tiêu của bước này là tìm ra thông số của mô hình nào có dự báo chính xác nhất.
Cải thiện
Khi nghiên cứu các giải pháp kinh doanh tốt nhất, các nhà khoa học dữ liệu thường phát triển một số mô hình Học Máy (Machine Learning) và sau đó chọn những mô hình đáp ứng tốt nhất các yêu cầu của dự án. Bước cải tiến liên quan đến việc tối ưu hóa kết quả phân tích. Ví dụ: sử dụng các kỹ thuật tổng hợp mô hình, có thể đạt được dự báo chính xác hơn. Trong trường hợp đó, độ chính xác được tính bằng cách kết hợp kết quả của nhiều mô hình dự báo.
Triển khai
Giai đoạn này giả định tích hợp (các) mô hình dự báo vào sử dụng sản xuất. Chúng tôi cũng khuyên bạn nên thiết lập quy trình tổng hợp dữ liệu mới để sử dụng cho các tính năng AI tiếp theo của mình. Điều này có thể giúp bạn tiết kiệm rất nhiều công việc chuẩn bị dữ liệu trong các dự án trong tương lai. Làm điều này cũng làm tăng độ chính xác và đa dạng của những gì bạn có thể dự báo.
Các yếu tố chính ảnh hưởng đến dự báo nhu cầu
Nhiệm vụ dự báo nhu cầu phụ thuộc vào rất nhiều yếu tố rõ ràng và không rõ ràng. Dưới đây là những cái có tác động nhiều nhất.
LOẠI SẢN PHẨM VÀ LỖI MÔ HÌNH HÓA
Loại sản phẩm là một yếu tố quan trọng cần xem xét cho mô hình nhu cầu. Ví dụ: đối với một mặt hàng dễ hỏng có nhu cầu thực tế là 100 trường hợp, dự đoán bán 90 trường hợp được ưu tiên hơn dự đoán 110 trường hợp. Thiếu doanh số 10 trường hợp là kết quả tốt hơn là lãng phí 10 trường hợp, mặc dù lỗi thực tế là cùng một tỷ lệ phần trăm.
TÁC ĐỘNG CỦA KHU VỰC ĐẾN HIỆU SUẤT MÔ HÌNH
Các mô hình dự đoán bị ảnh hưởng mạnh mẽ bởi các yếu tố khu vực bao gồm hành vi của khách hàng và các yếu tố quyết định văn hóa. Chúng cũng bao gồm những điều sau đây:
- Các chiến dịch tiếp thị có thể cụ thể theo khu vực và có tác động khác nhau tùy thuộc vào vị trí của khách hàng.
- Ngày lễ có thể khác nhau giữa các vùng, đây có thể là một cân nhắc để điều chỉnh mô hình.
- Các vấn đề pháp lý/luật pháp có thể hạn chế việc sử dụng một số dữ liệu nhất định ở các khu vực khác nhau.
ĐỐI THỦ CẠNH TRANH MỚI TRÊN THỊ TRƯỜNG
Dự báo nhu cầu là một khái niệm năng động. Càng có nhiều đối thủ cạnh tranh và các sản phẩm thay thế sản phẩm trên thị trường, dự báo nhu cầu càng trở nên khó khăn hơn. Mức độ cạnh tranh bao gồm các yếu tố phụ, chẳng hạn như số lượng sản phẩm thay thế và đối thủ cạnh tranh.
Vì vậy, bạn nên thêm thông tin này một cách linh hoạt vào mô hình dự báo nhu cầu của mình.
TÌNH HÌNH KINH TẾ
Tình trạng của nền kinh tế ảnh hưởng đến các doanh nghiệp và các mô hình dự báo nhu cầu. Nói một cách thẳng thắn hơn: thời kỳ suy giảm kinh tế có khả năng gây ra nhu cầu thấp hơn đối với các sản phẩm đắt tiền, mặc dù doanh số bán hàng hóa giá rẻ có thể tăng lên. Do đó, tình hình kinh tế cũng như xu hướng không phải là yếu tố bên ngoài và cần được xem xét khi xây dựng mô hình AI.
Dự báo bán hàng cho bán lẻ trong thời kỳ không chắc chắn
Khi tích hợp các hệ thống dự báo nhu cầu, điều cần thiết là phải hiểu rằng chúng dễ bị tổn thương trước sự bất thường hoặc các tình huống không thể đoán trước. Điều đó có nghĩa là các mô hình Học Máy (Machine Learning) nên được nâng cấp theo thực tế hiện tại.
Khi mô hình dự báo nhu cầu xử lý dữ liệu lịch sử, nó không thể biết rằng nhu cầu đã thay đổi hoàn toàn. Ví dụ, nếu năm ngoái, chúng ta có một chỉ số nhu cầu về khẩu trang y tế và thuốc kháng vi-rút, thì năm nay, nó sẽ hoàn toàn khác.
Trong trường hợp đó, có thể có một số cách để có được dự báo chính xác. Dưới đây là sáu cách phổ biến nhất:
- Thu thập dữ liệu về hành vi thị trường mới. Khi tình hình trở nên ổn định hơn hoặc ít hơn, hãy phát triển mô hình dự báo nhu cầu từ đầu.
- Áp dụng phương pháp kỹ thuật tính năng. Bằng cách xử lý dữ liệu bên ngoài, tin tức, trạng thái thị trường hiện tại, chỉ số giá, tỷ giá hối đoái và các yếu tố kinh tế khác, các mô hình Học Máy (Machine Learning) có khả năng đưa ra dự báo cập nhật hơn.
- Tải lên dữ liệu gần đây nhất và cung cấp cho nó trọng số cao nhất trong quá trình dự đoán mô hình. Khoảng thời gian của tập dữ liệu có thể tải có thể thay đổi từ một đến hai tháng, tùy thuộc vào danh mục sản phẩm. Bằng cách này, chúng tôi có thể phát hiện sự thay đổi trong mô hình nhu cầu và nâng cao độ chính xác của dự báo một cách kịp thời.
- Áp dụng phương pháp học chuyển tiếp. Nếu có bất kỳ dữ liệu lịch sử nào được thu thập, chúng ta có thể sử dụng nó để dự đoán nhu cầu trong bối cảnh khủng hoảng hiện tại.
- Áp dụng phương pháp mô hình hóa tầng thông tin. Chúng ta có thể dự báo cách mọi người sẽ đưa ra quyết định mua hàng theo mô hình hành vi của hầu hết mọi người.
- Một cách tiếp cận xử lý ngôn ngữ tự nhiên (NLP). Công nghệ NLP cho phép xử lý các bình luận thực từ các mạng xã hội, nền tảng truyền thông và các nguồn xã hội có sẵn khác. Bằng cách sử dụng các phương pháp khai thác văn bản và phân tích tình cảm, các mô hình NLP thu thập các mẫu cuộc trò chuyện của khách hàng để phát hiện sở thích, lựa chọn, tình cảm và thay đổi hành vi của mọi người.
Trong quá trình phát triển ứng dụng AI, các kỹ sư AI phân tích dữ liệu lịch sử để dự báo. Dự báo này không thể dự đoán được sự gián đoạn do đại dịch toàn cầu gây ra. Một sự kiện như vậy đòi hỏi phải hiệu chỉnh lại các mô hình Học Máy (Machine Learning). Chúng tôi đã đáp ứng thách thức này bằng cách sử dụng các mô hình Học Máy (Machine Learning) được phát triển cho một doanh nghiệp nhà hàng trước đại dịch.
Nhưng hãy nhớ rằng sau khi tình hình nhu cầu bình thường hóa sau đại dịch / chiến tranh / v.v. – bạn cần điều chỉnh lại mô hình của mình, vì trong các trường hợp khác – mô hình có thể nhớ mô hình của đại dịch và dự đoán nó trong khoảng thời gian ngắn tiếp theo (ví dụ: năm tới).
Các kỹ sư Machine Learning của chúng tôi sẽ sẵn lòng làm việc trong dự án dự báo của bạn. Hãy cho chúng tôi biết về nhu cầu kinh doanh của bạn và chúng tôi sẽ tìm ra giải pháp tốt nhất để đáp ứng chúng.
Nguồn : mobidev.biz