fresh Mạnh, Tiếng Nga từ: Nyet [Không có]. Đến cuối bài đăng này tôi hy vọng bạn sẽ đồng ý. Trường hợp xấu nhất bạn sẽ có thức ăn cho các tư tưởng.

Điều này bao gồm đăng bài sâu một chủ đề phức tạp mà có thể không được áp dụng cho tất cả mọi người, nhưng nó bao gồm một khu vực để các công ty có struggled để cố gắng hiển thị trở lại trên đầu tư thực hiện trong các kỹ năng, công nghệ và thời gian. Việc đăng bài hứa hẹn rõ nét và hướng dẫn hy vọng rằng sẽ làm cho bạn tiết kiệm tấn tăng nặng và thậm chí có một thay đổi tốt đẹp của chunk.

Khai khoáng dữ liệu và Predictive Analytics có hứa hẹn một đất, mặt trăng và Sun Fo sometime nay, trong tất cả các kênh mà chúng tôi kinh doanh tâm điểm của cá nhân tôi xem là trên trang web mà họ rơi xa ngắn của hầu hết các bi quan, ngay cả những hứa hẹn. Để có ngay bây giờ.

Là một người đã trưởng thành trong thế giới của truyền thống, quyết định hỗ trợ các hệ thống (ồ ạt lớn kho dữ liệu, các hệ thống kinh doanh thông minh và các công cụ, các hệ thống ERP & CRM) Tôi có cơ hội để được trên cả hai thị trường / kinh doanh bên cũng như phát triển và việc triển khai thực hiện phản ứng của sự vật.

Hiện tại không có gì mát hơn tưởng tượng tất cả những điều tuyệt vời đó sẽ đến nếu bạn chỉ cần di chuyển xa hơn báo cáo, và thậm chí phân tích, để thực hiện đúng các dữ liệu khai Predictive và phân tích. Đó là khó, nhưng có thể là đáng làm.

Rất nhiều nhà tư vấn (tôi có nhận thức được những irony đây) sẽ bán các bạn này rất có hiệu quả.

no outlet Hoàn toàn dữ liệu trên trang web sadly mặc dù nó không hoạt động được.

Nhiều khi bạn có thể mong muốn nó, nhiều như bạn có thể nó sẽ xảy ra. Dữ liệu truyền thống của bạn khai nỗ lực và các nguồn lực và $ $ $ chi Predictive phân tích sẽ làm sản lượng rất ít và hiếm khi nhìn thấy actionable. Hầu hết thời gian nó sẽ chứng minh là một tiểu tối ưu việc sử dụng thời gian và năng lượng.

[Tôi có thể xem các nhà phân tích thông minh giữa các bạn nhận được off của bạn ghế và mutter obscenities theo hơi thở của bạn.]

Có một số rất có thế lực, và không rõ ràng, yếu tố làm việc đối với bạn khi nói đến exploitable xu hướng tìm kiếm và trang web của bạn trong các mẫu dữ liệu, các loại mà bạn đang sử dụng để ở ngoại tuyến và erp / CRM loại môi trường. Trước khi bạn quyết định đổ $ $ $ và các hệ thống và nhân dân vào trang web của bạn Predictive xin vui lòng xem xét việc phân tích những nỗ lực trong phần còn lại của bài đăng này.

Gần đây tôi đã có cơ hội tuyệt vời để có mặt tại các khu vực vịnh ACM Ngày Khai khoáng Nhóm đặc biệt quan tâm. Đây là động cuối cùng của tôi trình bày:

Data mining and predictive analytics challenge

Các động, thay mặt trên của tôi, seî chuûp tinh túy của các thách thức khi đến làm Predictive Analytics với các trang web dữ liệu. Hãy để tôi giải thích.

# 1 Loại dữ liệu:

Điều quan trọng là nhận ra rằng trang web dữ liệu cho phần lớn là hoàn toàn vô danh, thường là không đầy đủ và thực sự thực sự không có cấu trúc. Khi bạn muốn làm truyền thống dữ liệu khai (và không chỉ là phân tích) và Predictive phân tích tất cả những việc này là chất độc.

Bạn đang tìm kiếm các xu hướng lớn hơn và phức tạp trong các mẫu dữ liệu cho người dân, các sản phẩm, kết quả, hành vi trên đủ lớn thời gian để bạn có thể tìm thấy cái gì insightful mà cũng có thể được exploitable.

Điều đó thực sự là khó có thể làm khi điều cốt lõi mà bạn đang Nhờ nắm bắt được các dữ liệu ẩn danh các tập tin cookie và javascript thẻ rằng rất có thể được, chúng tôi sẽ nói, nhạy cảm. And that's just the tip of the iceberg.

Tất cả những điều này làm cho nó rất nhiều khó tie hành vi ứng xử của người dân đến kết quả mà họ có thể được lái xe (trên bất kỳ loại trang web, eCommerce hay không). Có nếu bạn đăng nhập ID của người nắm bắt và có kết nối đến một thực tế rằng con người của các chi tiết ngoại tuyến của bạn từ hệ thống và làm việc này cho mỗi một người truy cập vấn đề này một chút eases (anonymity các phần), nhưng hầu hết vẫn còn ở đó.

variables

# 2 Số lượng các biến:

Số người hành xử theo cách điên ngoại tuyến, họ có nhiều điểm liên lạc và không sử dụng hoàn hảo tên và địa chỉ vv Tất cả những nơi này là nhiều hơn nữa điên trong thế giới trực tuyến.

Chúng tôi đã thảo luận trên blog này như thế nào đó không phải là một thế giới trực tuyến hay ngoại tuyến một thế giới mà nó là một thế giới nonline! Điều này có nghĩa là mọi người lưu giữa các kênh liên lạc và có số điểm và có thể là một kết quả (dẫn đầu, mua hàng, giải quyết vấn đề) tại một kênh hoàn toàn khác nhau hơn đã được hầu hết các giao dịch được. Bạn có thể tưởng tượng như thế nào điều này sẽ hoàn toàn screw lên SAS của bạn hoặc SPES hoặc Clementine hoặc các nhà phát triển giải pháp.

Dưới đây là một mà nhiều người trong chúng ta thấp sự. Nó là dễ dàng hơn cho tôi và sau đó Predict khi có một số tiền của các tổ chức phi-siloed tồn tại. Trên trang web của Google là cạnh tranh với một guy pony của mình và cùng nhau đặt một công cụ tìm kiếm mới. Không chỉ có khá nhiều rào cản không cho nhập cảnh, nhưng nó rất dễ dàng cho các khách hàng của bạn để flirt với các đối thủ cạnh tranh của bạn và cho các đối thủ cạnh tranh của bạn để phản ứng lại cho bạn một cách ồ ạt theo cách hiệu quả.

Vì vậy, có ba đến mua hàng tiêu biểu? (Gì về hai lần truy cập vào một cửa hàng ở giữa?) Is $ 15 off cho những người từ Florida chiến lược tốt nhất? (Điều gì sẽ xảy ra cho rằng khi các đối thủ cạnh tranh của bạn chạy xâm UBND tỉnh?) Là "Tony" và thăm tất cả các quy cho Tony Tony thực sự? (Gì về các tập tin cookie và vợ tôi và tôi và tất cả các Damini Amazon lướt trên cùng một tên đăng nhập?)

Và đây là những gì xảy ra, thời gian của bạn kiểm soát cho các biến, bạn có thể truy cập và tài khoản cho (trong khi ném đi tất cả những gì bạn có thể không) War bạn là trái với một ly nước (và bạn bắt đầu với một đại dương đầy nước ) và khả năng của bạn để dự đoán bất cứ điều gì để mở rộng ồ ạt actionable nhìn thấy sâu hơn là hạn chế. Nó chỉ là một ly nước sau khi tất cả mọi người. :)

multiple purposes

# 3 Nhiều Tiểu học Mục đích:

Trên trang web này complicates vật. Chúng tôi đang cố gắng để dự đoán kết quả của trang web của chúng tôi, một phức tạp đang tồn tại mà phải làm rất nhiều (thậm chí cả những thứ trang web của bạn đã được tạo ra cho không).

Vì vậy, nếu nó không giống như bạn có một kênh khác ghé thăm và kết quả là khá dễ dàng nhận dạng ở cấp độ cao nhất sau đó làm thế nào để bạn tôi và Predict?

Tôi đã thường xuyên nhấn mạnh tầm quan trọng của việc đo lường Tiểu học Mục đích vì sức mạnh mà xuất phát từ thực tế sự hiểu biết về lý do tại sao mọi người hãy truy cập vào trang web. Kết nối với hai điều Tiểu học Mục đích của bạn lên mess Khai khoáng và dự báo các nỗ lực:

1) Bạn không biết tất cả các mục đích chính (bấm vào đây để tìm hiểu cách thức bạn có thể tìm hiểu).
2) Đây là incredibly khó khăn để có bộ sưu tập của bạn lớn của các nhấp chuột và truy cập và sau đó gán chúng vào mỗi mục đích chính xô và sau đó dự đoán trên đó.

3) Xem dưới đây.

# 4 Nhiều người truy cập Hành vi:

multi tasking Điều này thực sự điều screws up. Bạn có thể dự đoán khung tâm (Mục đích chính) khi bạn gửi cho mọi người mẩu thư. Bạn có thể dự đoán những gì mọi người muốn / nghĩ rằng khi họ muốn vào các siêu thị / cửa hàng. Bạn có thể tạo thành nhiều hơn các ví dụ về việc chúng tôi tất cả các phân tích và tôi và Predict.

Nó là một cơn đau để đi đến một cửa hàng và sau đó đi có nhiều hơn sáu lần. Trên trang web này là nhỏ. Khó chuyển đổi bất kỳ trong một trang web truy cập.

Nó cũng là đau khổ để đến cửa hàng cho mọi vấn đề bạn có hay mỗi câu hỏi mà bạn có. Trên trang web này là nhỏ. Bạn có thể có cùng một người đến với trang web của bạn như là một người khác nhau nhiều lần để giải quyết một vấn đề khác nhau.

Các câu hỏi như bạn có sẵn sàng để phân tích đa terabyte cơ sở dữ liệu của bạn là: Làm thế nào để bạn có thể cô lập trong hành vi này của bạn nhấp chuột không? Với bao nhiêu tự tin?

Trên giấy nó dễ dàng, nhưng âm thanh trong thực tế nó là incredibly khó theo cho nhiều hành vi truy cập, ngay cả khi bạn có nixed về vấn đề thu thập dữ liệu một cách chính xác cho mỗi người và cho mỗi lần truy cập của họ.

missing keys

# 5 Thiếu Tiểu học Keys, Ngày Silos, Thiếu Holistic dữ liệu:

Một trong những cách để làm tốt hơn tại dự đoán là dữ liệu để đưa quý vị ra khỏi trang web silos phân tích và hợp nhất nó với các bộ dữ liệu của khách hàng trong công ty của bạn (các cửa hàng và siêu thị, kênh điện thoại, những người khác). Nếu bạn đã biết tất cả các liên lạc costumer điểm và đã kết hợp dữ liệu, sau đó nó được dễ dàng hơn rất nhiều để hiểu hiện tại và dự đoán trong tương lai các hành vi hành vi ứng xử và kết quả.

Đây là kịch bản Nirvana crushed của một vài thay ung cà chua.

Chúng tôi rất quen thuộc với tất cả các chiến dịch và untagged trang. Chúng tôi cũng biết rằng url tham số không luôn luôn làm việc trong việc giúp đỡ chúng tôi thu thập dữ liệu. Vấn đề gây ra nhiều vấn đề là thực tế, hầu hết các công ty không khá forethought đặt các yêu cầu để tạo ra ở bên phải "chìa khóa chính" này sẽ cho phép dữ liệu từ các kênh khác nhau để được hooked lập lại với nhau.

Thậm chí còn có vấn đề với tên và địa chỉ và số điện thoại thu thập và lưu trữ một cách khác nhau, cả hai gây ra một dữ liệu hòa nightmare nhưng cụ thể của các bài đăng này gây ra những thách thức lớn trong phân tích kết quả.

Đối với các dữ liệu phân tích Predictive mỏ và tích cực đến sản lượng thu nhập từ đầu tư của công ty bạn sẽ phải đặt rất nhiều forethought vào quá trình thu thập và lưu trữ dữ liệu trên các kênh và trong sâu bowels của trang web của bạn / erp / hệ thống CRM. Nếu hành động đó không phải là sản phẩm hoàn thành sau đó đánh dấu nó là tối ưu để tập trung vào đó trước khi cắt một công cụ cho chq / người để làm Khai khoáng và dự báo.

rapid change

# 6 Massive Pace của Thay đổi trên Web:

Chắc chắn của Google, Yahoo, CNN, Craigslist, Amazon, Ebay, New York Times luôn luôn có được ở đó. Nó có thể thậm chí có vẻ như điều không bao giờ thay đổi.

Thật không may cho bạn và tôi không phải là trò chơi khá giống nhau. Các trang web được liên tục thay đổi. Cách thức mọi người kinh nghiệm nó, cách thức mọi người cạnh tranh, cách thức mọi người đọc và đề nghị mua, con đường tất cả mọi thứ sẽ xảy ra.

Làm Predictive khai và phân tích về hành vi trong quá khứ đòi hỏi một số tiền nhất định của "ổn định" về tương lai của bạn (khách hàng, kinh doanh, kết quả vv vv). Nhưng nếu là "môi trường" thay đổi quá nhiều, hoặc thậm chí là đủ, sau đó dự đoán của bạn về hành vi trong quá khứ sẽ chỉ có cơ hội nhỏ bé của thành công.

Để bây giờ có lẽ đây là một trong những thách thức lớn nhất để phân tích và Statisticians người đang làm việc khó khăn để có được một số các truyền thống và khai Predictive thuật toán để làm việc trên web của chúng tôi dữ liệu.

fortune cookie

Bài viết trên Wikipedia Predictive Phân tích kết thúc với tuyên bố này:

"Predictive phân tích cho biết thêm giá trị cho một doanh nghiệp đưa ra các quyết định cho phép các khả năng của nó để xây dựng các chính sách thông minh trên cơ sở dự báo về kết quả trong tương lai. Một mở rộng phạm vi các công cụ và kỹ thuật sẵn có cho những loại hình này phân tích và lựa chọn của họ được xác định bằng cách phân tích các kỳ hạn thanh toán của các doanh nghiệp cũng như các yêu cầu cụ thể của vấn đề được giải quyết. "

Tôi nghĩ rằng sẽ để lại với quý vị và căng thẳng mà bạn xem xét:

1] kỳ hạn thanh toán của doanh nghiệp của bạn

2] yêu cầu của vấn đề mà bạn đang giải quyết

3] sáu bài đề cập đến trong bài đăng này và thời tiết

4] bạn cố định tất cả các "thấp treo trái cây"?

Ok bây giờ các bạn lần lượt.

Tất cả những gì bạn nghĩ? Bạn có đồng ý việc này là khó khăn? Có lẽ bạn đã subdued vấn đề khó khăn này? Có lẽ đó là một trong flaw Giả thuyết của tôi?

Xin vui lòng chia sẻ của bạn mẹo, thủ đoạn, những câu chuyện chiến tranh, critique, brickbats thông qua ý kiến.

[Giống như bài đăng này? Để biết thêm các bài viết như thế này xin vui lòng bấm vào đây, nếu nó có thể được quan tâm xin vui lòng kiểm tra của tôi cuốn sách: Phân tích web: Một Giờ Đáp ngày.]

Xã hội Bookmarks:

  • co.mments
  • del.icio.us
  • Reddit
  • Google Bookmarks
  • StumbleUpon
  • Sphinn
  • Digg
  • Facebook
  • FriendFeed
  • LinkedIn
  • Turn this article into a PDF!