Khai khoáng dữ liệu và Predictive Phân tích dữ liệu hoạt động trên web? Nyet!
Mạnh, Tiếng Nga từ: Nyet [Không có]. Đến cuối bài đăng này tôi hy vọng bạn sẽ đồng ý. Trường hợp xấu nhất bạn sẽ có thức ăn cho các tư tưởng.
Điều này bao gồm đăng bài sâu một chủ đề phức tạp mà có thể không được áp dụng cho tất cả mọi người, nhưng nó bao gồm một khu vực để các công ty có struggled để cố gắng hiển thị trở lại trên đầu tư thực hiện trong các kỹ năng, công nghệ và thời gian. Việc đăng bài hứa hẹn rõ nét và hướng dẫn hy vọng rằng sẽ làm cho bạn tiết kiệm tấn tăng nặng và thậm chí có một thay đổi tốt đẹp của chunk.
Khai khoáng dữ liệu và Predictive Analytics có hứa hẹn một đất, mặt trăng và Sun Fo sometime nay, trong tất cả các kênh mà chúng tôi kinh doanh tâm điểm của cá nhân tôi xem là trên trang web mà họ rơi xa ngắn của hầu hết các bi quan, ngay cả những hứa hẹn. Để có ngay bây giờ.
Là một người đã trưởng thành trong thế giới của truyền thống, quyết định hỗ trợ các hệ thống (ồ ạt lớn kho dữ liệu, các hệ thống kinh doanh thông minh và các công cụ, các hệ thống ERP & CRM) Tôi có cơ hội để được trên cả hai thị trường / kinh doanh bên cũng như phát triển và việc triển khai thực hiện phản ứng của sự vật.
Hiện tại không có gì mát hơn tưởng tượng tất cả những điều tuyệt vời đó sẽ đến nếu bạn chỉ cần di chuyển xa hơn báo cáo, và thậm chí phân tích, để thực hiện đúng các dữ liệu khai Predictive và phân tích. Đó là khó, nhưng có thể là đáng làm.
Rất nhiều nhà tư vấn (tôi có nhận thức được những irony đây) sẽ bán các bạn này rất có hiệu quả.
Hoàn toàn dữ liệu trên trang web sadly mặc dù nó không hoạt động được.
Nhiều khi bạn có thể mong muốn nó, nhiều như bạn có thể nó sẽ xảy ra. Dữ liệu truyền thống của bạn khai nỗ lực và các nguồn lực và $ $ $ chi Predictive phân tích sẽ làm sản lượng rất ít và hiếm khi nhìn thấy actionable. Hầu hết thời gian nó sẽ chứng minh là một tiểu tối ưu việc sử dụng thời gian và năng lượng.
[Tôi có thể xem các nhà phân tích thông minh giữa các bạn nhận được off của bạn ghế và mutter obscenities theo hơi thở của bạn.]
Có một số rất có thế lực, và không rõ ràng, yếu tố làm việc đối với bạn khi nói đến exploitable xu hướng tìm kiếm và trang web của bạn trong các mẫu dữ liệu, các loại mà bạn đang sử dụng để ở ngoại tuyến và erp / CRM loại môi trường. Trước khi bạn quyết định đổ $ $ $ và các hệ thống và nhân dân vào trang web của bạn Predictive xin vui lòng xem xét việc phân tích những nỗ lực trong phần còn lại của bài đăng này.
Gần đây tôi đã có cơ hội tuyệt vời để có mặt tại các khu vực vịnh ACM Ngày Khai khoáng Nhóm đặc biệt quan tâm. Đây là động cuối cùng của tôi trình bày:
Các động, thay mặt trên của tôi, seî chuûp tinh túy của các thách thức khi đến làm Predictive Analytics với các trang web dữ liệu. Hãy để tôi giải thích.
# 1 Loại dữ liệu:
Điều quan trọng là nhận ra rằng trang web dữ liệu cho phần lớn là hoàn toàn vô danh, thường là không đầy đủ và thực sự thực sự không có cấu trúc. Khi bạn muốn làm truyền thống dữ liệu khai (và không chỉ là phân tích) và Predictive phân tích tất cả những việc này là chất độc.
Bạn đang tìm kiếm các xu hướng lớn hơn và phức tạp trong các mẫu dữ liệu cho người dân, các sản phẩm, kết quả, hành vi trên đủ lớn thời gian để bạn có thể tìm thấy cái gì insightful mà cũng có thể được exploitable.
Điều đó thực sự là khó có thể làm khi điều cốt lõi mà bạn đang Nhờ nắm bắt được các dữ liệu ẩn danh các tập tin cookie và javascript thẻ rằng rất có thể được, chúng tôi sẽ nói, nhạy cảm. And that's just the tip of the iceberg.
Tất cả những điều này làm cho nó rất nhiều khó tie hành vi ứng xử của người dân đến kết quả mà họ có thể được lái xe (trên bất kỳ loại trang web, eCommerce hay không). Có nếu bạn đăng nhập ID của người nắm bắt và có kết nối đến một thực tế rằng con người của các chi tiết ngoại tuyến của bạn từ hệ thống và làm việc này cho mỗi một người truy cập vấn đề này một chút eases (anonymity các phần), nhưng hầu hết vẫn còn ở đó.
# 2 Số lượng các biến:
Số người hành xử theo cách điên ngoại tuyến, họ có nhiều điểm liên lạc và không sử dụng hoàn hảo tên và địa chỉ vv Tất cả những nơi này là nhiều hơn nữa điên trong thế giới trực tuyến.
Chúng tôi đã thảo luận trên blog này như thế nào đó không phải là một thế giới trực tuyến hay ngoại tuyến một thế giới mà nó là một thế giới nonline! Điều này có nghĩa là mọi người lưu giữa các kênh liên lạc và có số điểm và có thể là một kết quả (dẫn đầu, mua hàng, giải quyết vấn đề) tại một kênh hoàn toàn khác nhau hơn đã được hầu hết các giao dịch được. Bạn có thể tưởng tượng như thế nào điều này sẽ hoàn toàn screw lên SAS của bạn hoặc SPES hoặc Clementine hoặc các nhà phát triển giải pháp.
Dưới đây là một mà nhiều người trong chúng ta thấp sự. Nó là dễ dàng hơn cho tôi và sau đó Predict khi có một số tiền của các tổ chức phi-siloed tồn tại. Trên trang web của Google là cạnh tranh với một guy pony của mình và cùng nhau đặt một công cụ tìm kiếm mới. Không chỉ có khá nhiều rào cản không cho nhập cảnh, nhưng nó rất dễ dàng cho các khách hàng của bạn để flirt với các đối thủ cạnh tranh của bạn và cho các đối thủ cạnh tranh của bạn để phản ứng lại cho bạn một cách ồ ạt theo cách hiệu quả.
Vì vậy, có ba đến mua hàng tiêu biểu? (Gì về hai lần truy cập vào một cửa hàng ở giữa?) Is $ 15 off cho những người từ Florida chiến lược tốt nhất? (Điều gì sẽ xảy ra cho rằng khi các đối thủ cạnh tranh của bạn chạy xâm UBND tỉnh?) Là "Tony" và thăm tất cả các quy cho Tony Tony thực sự? (Gì về các tập tin cookie và vợ tôi và tôi và tất cả các Damini Amazon lướt trên cùng một tên đăng nhập?)
Và đây là những gì xảy ra, thời gian của bạn kiểm soát cho các biến, bạn có thể truy cập và tài khoản cho (trong khi ném đi tất cả những gì bạn có thể không) War bạn là trái với một ly nước (và bạn bắt đầu với một đại dương đầy nước ) và khả năng của bạn để dự đoán bất cứ điều gì để mở rộng ồ ạt actionable nhìn thấy sâu hơn là hạn chế. Nó chỉ là một ly nước sau khi tất cả mọi người. :)
# 3 Nhiều Tiểu học Mục đích:
Trên trang web này complicates vật. Chúng tôi đang cố gắng để dự đoán kết quả của trang web của chúng tôi, một phức tạp đang tồn tại mà phải làm rất nhiều (thậm chí cả những thứ trang web của bạn đã được tạo ra cho không).
Vì vậy, nếu nó không giống như bạn có một kênh khác ghé thăm và kết quả là khá dễ dàng nhận dạng ở cấp độ cao nhất sau đó làm thế nào để bạn tôi và Predict?
Tôi đã thường xuyên nhấn mạnh tầm quan trọng của việc đo lường Tiểu học Mục đích vì sức mạnh mà xuất phát từ thực tế sự hiểu biết về lý do tại sao mọi người hãy truy cập vào trang web. Kết nối với hai điều Tiểu học Mục đích của bạn lên mess Khai khoáng và dự báo các nỗ lực:
1) Bạn không biết tất cả các mục đích chính (bấm vào đây để tìm hiểu cách thức bạn có thể tìm hiểu).
2) Đây là incredibly khó khăn để có bộ sưu tập của bạn lớn của các nhấp chuột và truy cập và sau đó gán chúng vào mỗi mục đích chính xô và sau đó dự đoán trên đó.
3) Xem dưới đây.
# 4 Nhiều người truy cập Hành vi:
Điều này thực sự điều screws up. Bạn có thể dự đoán khung tâm (Mục đích chính) khi bạn gửi cho mọi người mẩu thư. Bạn có thể dự đoán những gì mọi người muốn / nghĩ rằng khi họ muốn vào các siêu thị / cửa hàng. Bạn có thể tạo thành nhiều hơn các ví dụ về việc chúng tôi tất cả các phân tích và tôi và Predict.
Nó là một cơn đau để đi đến một cửa hàng và sau đó đi có nhiều hơn sáu lần. Trên trang web này là nhỏ. Khó chuyển đổi bất kỳ trong một trang web truy cập.
Nó cũng là đau khổ để đến cửa hàng cho mọi vấn đề bạn có hay mỗi câu hỏi mà bạn có. Trên trang web này là nhỏ. Bạn có thể có cùng một người đến với trang web của bạn như là một người khác nhau nhiều lần để giải quyết một vấn đề khác nhau.
Các câu hỏi như bạn có sẵn sàng để phân tích đa terabyte cơ sở dữ liệu của bạn là: Làm thế nào để bạn có thể cô lập trong hành vi này của bạn nhấp chuột không? Với bao nhiêu tự tin?
Trên giấy nó dễ dàng, nhưng âm thanh trong thực tế nó là incredibly khó theo cho nhiều hành vi truy cập, ngay cả khi bạn có nixed về vấn đề thu thập dữ liệu một cách chính xác cho mỗi người và cho mỗi lần truy cập của họ.
# 5 Thiếu Tiểu học Keys, Ngày Silos, Thiếu Holistic dữ liệu:
Một trong những cách để làm tốt hơn tại dự đoán là dữ liệu để đưa quý vị ra khỏi trang web silos phân tích và hợp nhất nó với các bộ dữ liệu của khách hàng trong công ty của bạn (các cửa hàng và siêu thị, kênh điện thoại, những người khác). Nếu bạn đã biết tất cả các liên lạc costumer điểm và đã kết hợp dữ liệu, sau đó nó được dễ dàng hơn rất nhiều để hiểu hiện tại và dự đoán trong tương lai các hành vi hành vi ứng xử và kết quả.
Đây là kịch bản Nirvana crushed của một vài thay ung cà chua.
Chúng tôi rất quen thuộc với tất cả các chiến dịch và untagged trang. Chúng tôi cũng biết rằng url tham số không luôn luôn làm việc trong việc giúp đỡ chúng tôi thu thập dữ liệu. Vấn đề gây ra nhiều vấn đề là thực tế, hầu hết các công ty không khá forethought đặt các yêu cầu để tạo ra ở bên phải "chìa khóa chính" này sẽ cho phép dữ liệu từ các kênh khác nhau để được hooked lập lại với nhau.
Thậm chí còn có vấn đề với tên và địa chỉ và số điện thoại thu thập và lưu trữ một cách khác nhau, cả hai gây ra một dữ liệu hòa nightmare nhưng cụ thể của các bài đăng này gây ra những thách thức lớn trong phân tích kết quả.
Đối với các dữ liệu phân tích Predictive mỏ và tích cực đến sản lượng thu nhập từ đầu tư của công ty bạn sẽ phải đặt rất nhiều forethought vào quá trình thu thập và lưu trữ dữ liệu trên các kênh và trong sâu bowels của trang web của bạn / erp / hệ thống CRM. Nếu hành động đó không phải là sản phẩm hoàn thành sau đó đánh dấu nó là tối ưu để tập trung vào đó trước khi cắt một công cụ cho chq / người để làm Khai khoáng và dự báo.
# 6 Massive Pace của Thay đổi trên Web:
Chắc chắn của Google, Yahoo, CNN, Craigslist, Amazon, Ebay, New York Times luôn luôn có được ở đó. Nó có thể thậm chí có vẻ như điều không bao giờ thay đổi.
Thật không may cho bạn và tôi không phải là trò chơi khá giống nhau. Các trang web được liên tục thay đổi. Cách thức mọi người kinh nghiệm nó, cách thức mọi người cạnh tranh, cách thức mọi người đọc và đề nghị mua, con đường tất cả mọi thứ sẽ xảy ra.
Làm Predictive khai và phân tích về hành vi trong quá khứ đòi hỏi một số tiền nhất định của "ổn định" về tương lai của bạn (khách hàng, kinh doanh, kết quả vv vv). Nhưng nếu là "môi trường" thay đổi quá nhiều, hoặc thậm chí là đủ, sau đó dự đoán của bạn về hành vi trong quá khứ sẽ chỉ có cơ hội nhỏ bé của thành công.
Để bây giờ có lẽ đây là một trong những thách thức lớn nhất để phân tích và Statisticians người đang làm việc khó khăn để có được một số các truyền thống và khai Predictive thuật toán để làm việc trên web của chúng tôi dữ liệu.
Bài viết trên Wikipedia Predictive Phân tích kết thúc với tuyên bố này:
"Predictive phân tích cho biết thêm giá trị cho một doanh nghiệp đưa ra các quyết định cho phép các khả năng của nó để xây dựng các chính sách thông minh trên cơ sở dự báo về kết quả trong tương lai. Một mở rộng phạm vi các công cụ và kỹ thuật sẵn có cho những loại hình này phân tích và lựa chọn của họ được xác định bằng cách phân tích các kỳ hạn thanh toán của các doanh nghiệp cũng như các yêu cầu cụ thể của vấn đề được giải quyết. "
Tôi nghĩ rằng sẽ để lại với quý vị và căng thẳng mà bạn xem xét:
1] kỳ hạn thanh toán của doanh nghiệp của bạn
2] yêu cầu của vấn đề mà bạn đang giải quyết
3] sáu bài đề cập đến trong bài đăng này và thời tiết
4] bạn cố định tất cả các "thấp treo trái cây"?
Ok bây giờ các bạn lần lượt.
Tất cả những gì bạn nghĩ? Bạn có đồng ý việc này là khó khăn? Có lẽ bạn đã subdued vấn đề khó khăn này? Có lẽ đó là một trong flaw Giả thuyết của tôi?
Xin vui lòng chia sẻ của bạn mẹo, thủ đoạn, những câu chuyện chiến tranh, critique, brickbats thông qua ý kiến.
[Giống như bài đăng này? Để biết thêm các bài viết như thế này xin vui lòng bấm vào đây, nếu nó có thể được quan tâm xin vui lòng kiểm tra của tôi cuốn sách: Phân tích web: Một Giờ Đáp ngày.]



















































11 tháng chín, 2007 at 03:13
Tôi dự đoán, bạn sẽ nhận được ít nhất là thêm một nhận xét.
:-)
Tuy nhiên, những bài viết khác Avinash! Nếu tôi đã không đồng ý để nó sẽ chỉ được ở mức độ chi tiết một trong những chọn (?) Để dự đoán đến. Trong đó có thể là một / những ngụ ý quan trọng điểm trong sử dụng các dữ liệu khai et al?
Trong đó, tôi trong vai trò truyền thống của tôi thường xuyên buộc phải thực hiện các dự báo chính xác đến 5 năm dựa trên các trang web here'n'now dữ liệu. Có bao nhiêu người. Đồng thời là bao nhiêu. Trang. * Số lượt truy cập *!
Là: Năng lực sản xuất Kế hoạch và cho thuê được biết đôi: Phục hồi thiên tai.
Trong trường hợp đó, mặc dù ai có thể đi lang thang một chút cho thêm unforeseen tốc độ tăng trưởng. Như các chi phí không có đủ năng lực có thể được thêm rất nhiều tốn kém cho org.
Các giải pháp gì bây giờ tồn tại, nhưng tôi là straying quá xa ở đây. :-)
Tôi đoán là những gì tôi nói, là ngay cả với cruddy dữ liệu, đôi khi chúng tôi vẫn có để dự đoán. Liệu chúng tôi hay không.
"Nó quá khó tính. Nó không phải có thể được. "Không phải là một sự chấp nhận được câu trả lời! :-D
Chúc mừng!
- Steve
11 tháng chín, 2007 at 05:34
Tôi xin có blasted những người viết bài này đã có được bằng văn bản của trang Web Analytics phê bình, nhưng khi bạn viết Tôi buộc phải cho nó một vài suy nghĩ nghiêm trọng.
Một nghiên cứu từ Hội chợ Isaac đã có trước đó hiển thị nhấp vào gian lận là rất cao (khoảng 15%) so với những gì Yahoo hoặc Google đơn xin bồi hoàn. Hầu hết mọi người không đồng ý với nó, và sau Hội chợ Isaac tự đến chân quay lại nói với nó được thực hiện với các giới hạn dữ liệu.
Bây giờ trở lại sau khi đọc bài đăng này từ bạn, tôi nghĩ rằng có vài điều trong trang web bạn cần phải hoàn toàn mới sinh ra trong lĩnh vực khai dữ liệu và Phân tích.
NHƯNG tôi cảm thấy, dữ liệu đang có những thách thức trong mọi lĩnh vực được nó trực tuyến hay ngoại tuyến. Vấn đề là có, nhưng trong trang web, giải pháp nào được nêu ra là để không giống như kinh doanh ngoại tuyến. Vì vậy, tôi mất thời gian hơn là những vấn đề này sẽ được sắp xếp và phân tích giành chiến thắng ở đây quá.
Tất cả các điểm bạn có thể hiện thực sự là những thách thức cho tất cả mọi người trong chúng ta tham gia vào lĩnh vực này. Bằng nhau, nhưng quan trọng là để hiểu biết, quan tâm như thế nào là nhà quản lý kinh doanh của các khách hàng của chúng tôi trong hiểu biết những gì mà chúng tôi đang cố gắng nói cho họ. Họ có thể không được quan tâm làm sạch các dữ liệu mà bạn mong đợi nó vào được.
Điều này có thể đúng như trang web chủ sở hữu không cần phải lãng phí nguồn lực vào bất kỳ người truy cập vào trang web của cơ hoặc không có mua intentions. Họ không cần phải ưu tiên mà người dân tham gia và ai không phải không giống như các cửa hàng bán lẻ.
Đem lại cho các công ty quảng cáo trực tuyến sẽ được quan tâm để hiểu biết chuyển đổi của họ, nhưng những kiến thức về chuyển đổi tương đối (từ khóa được nhắm mục tiêu vs trang web nhắm mục tiêu, một trong những từ khóa vs khác) được sử dụng tốt. Và để tìm bất cứ điều gì liên quan, không phải của nó rất khó. Trong môi trường rất lớn của chuyến thăm, các khung thời gian cho một chiến dịch có thể được công bằng hơn.
Trong thời gian thay đổi hành vi. Nó thay đổi khá thường xuyên trong trang web, nhờ tiếp tục tiến công nghệ và các sản phẩm web 2.0. Điều này chỉ có các cuộc gọi để biết thêm hoạt động giám sát. Nó có thể là cần thiết để giám sát hàng ngày hoặc hàng tuần, nhưng wont được quá khó quá. Nó chỉ là rằng, làm cho doanh nghiệp quản lý này cần phải hiểu là khá khó khăn.
Đó là thực sự quan tâm trong tất cả các nhà kinh doanh không sử dụng các kết quả phân tích web mình. Nó sẽ tốt nhất nếu được cung cấp cho bên thứ ba những người có thể xử lý này và thực hiện việc này với sáng kiến tiếp thị trang web. Điều này có thể phân tích web có thể tiết kiệm chi phí sản phẩm quá. Và bất kỳ trang web của công ty tiếp thị có thể sử dụng công bằng một trong những công cụ để phân tích rất nhiều các trang web của các công ty khác nhau. Tạo sự hiểu biết tốt hơn của thị trường.
Tôi phải nói rằng, đây thực sự là một bài đăng từ bạn. Đơn giản chỉ cần disturbing và đầy thử thách. Cảm ơn bạn rất nhiều cho xuất bản ở đây.
Bhupendra
11 tháng chín, 2007 at 06:11
Hmmm ... này chắc chắn sẽ mang lại một số cuộc thảo luận thú vị! Thay đổi chủ đề từ "khai dữ liệu và phân tích Predictive" để "phân tích web" và các reread đăng bai. Ta có thể dễ dàng đi đến kết luận tương tự về phân tích web và các ném khăn (dĩ nhiên, chúng tôi sẽ không!).
Trong một cách, Predictive phân tích cố gắng để tự động hoá tất cả những gì chúng tôi cố gắng làm với phân tích web: cải thiện trong tương lai của chúng tôi dựa trên những gì chúng ta biết rằng từ trong quá khứ của chúng tôi. Nó giống như là cùng một thách thức và rủi ro. Nó phụ thuộc vào sức mạnh của chúng tôi magnifying kính.
Nhưng cuối cùng tôi đồng ý: trước khi nhảy trên Predictive bandwagon phân tích, có một địa ngục của rất nhiều thứ khác dễ dàng hơn để làm:)
11 tháng chín, 2007 at 06:18
Hi Avinash,
các bài viết của bạn luôn luôn là một trong những thú vị và điều này là một trong những tôi muốn đọc từ tôi là bạn đọc. Xem Tôi là tốt nghiệp thạc sĩ trong kinh doanh trí tuệ và tôi đã làm rất nhiều Predictive phân tích cho tất cả các loại dữ liệu bao gồm các trang web dữ liệu. Nhiều practionners quên rằng dữ liệu sẽ không bao giờ được trong sạch và hoàn hảo. Tôi không nói rằng tất cả các dữ liệu đến từ các tiền mặt đăng ký hoặc một trang web thương mại điện tử có liên quan nhưng tôi nghĩ rằng bạn thấy được vấn đề lớn hơn nó được. Trong BI, chúng tôi luôn luôn nói hai điều trên dữ liệu phân tích: 1) làm sạch dữ liệu mất 80% thời gian, phân tích có 20% 2) Có ý thức về GIGO (trong rác, rác thải ra). Đầu tiên, không có cấu trúc dữ liệu có thể được cấu trúc chặt chẽ với các phân biến hoặc các phương pháp thống kê (hoặc có nghĩa là tần số). Thứ hai, để thoát khỏi những vấn đề GIGO, bạn cần những người như tôi;).
Hơn nữa, khoa học littérature cung cấp rất nhiều bài viết về các mô hình Predictive sống như phân tích, và hậu tuyến regression, RFM (Recency, Tần số, giá trị tiền tệ) và Hiệp hội quy định (phân tích thị trường giá trong giỏ hàng) dựa trên các trang web dữ liệu. Ví dụ, Amazon là bằng cách sử dụng kết hợp để tăng cường cung cấp các quy định liên quan đến mua hàng của bạn trước đó.
Jean-Sebastien
11 tháng chín, 2007 at 06:29
Tôi đồng ý, tốt đẹp đăng Avinash.
Tôi đồng ý hoàn toàn nghiêng với bạn về những khó khăn trong inherent Predictive phân tích trên trang web. Nhưng tôi không nghĩ là bạn phác thảo những vấn đề ở đây là độc quyền để phân tích trang web, chúng được tìm thấy bất cứ khi nào bạn thử dự đoán và hành vi ứng xử - họ là những bane của tất cả các thị trường dựa trên phân tích.
Hãy quảng cáo nghiên cứu. Thế nào là tối ưu các mức độ chi tiêu quảng cáo trong đó mediums? Của bạn tiếp thị kết hợp cơ bản câu hỏi. Bạn có thể ném tất cả các biến có liên quan, bạn có thể tìm thấy vào một equation và vẫn còn có ít quyền lực Predictive như có một mức độ phức tạp, bạn không thể thu thập dữ liệu cho - trên thực tế, quyết định xử lý của ai đó trong đầu, chất lượng các tính chất của một quảng cáo, môi trường yếu tố tại POS. Trong một số trường hợp, nó giống như đang cố gắng hiểu cách thức con số trên thế giới hoạt động bằng cách tìm kiếm thông qua một rơm.
Các lỗi rất nhiều người dân thực hiện là để nói rằng đó là tất cả về 'dữ liệu tốt hơn'. Nó không phải. Hiện có một số điều bạn chỉ có thể không biết đầy đủ. Giao Lưu Kết quyết định từ không đầy đủ thông tin là nghệ thuật của nó tất cả mọi người.
".. Những ân huệ cho tôi để chấp nhận các điều tôi không thể đo lường, các biện pháp can đến những việc tôi có thể, và khôn ngoan để biết sự khác biệt."
11 tháng chín, 2007 at 06:42
Trong một doanh nghiệp phức tạp với nhiều CTPs và nhiều phân đoạn khách hàng khác nhau, xây dựng các khách hàng Holistic xem, khá là một thách thức.
Khách hàng có thể Holistic xem trang web kết hợp dữ liệu? - Hiện nay không.
Great đăng bai.
11 tháng chín, 2007 at 07:44
Trong một vài cách, bạn mô tả một sự khác biệt giữa nghệ thuật và khoa học.
Từ một khoa học standpoint, một trong những hy vọng có thể không phải làm đúng các dữ liệu khai trên trang web phân tích dữ liệu, do những lý do cho tất cả các bạn phác thảo trong bài viết của bạn. Của tôi "khoa học" đào tạo biết tất cả các imperfections, nhanh chóng trở thành paralyzed bởi magnitude của imperfections.
Từ một nghệ thuật standpoint, một số tiền gần như infinite thông tin có thể được sử dụng trong một cách thức thích hợp. Tiếp thị nền tảng của tôi biết có một zillion những thứ có thể được thực hiện. Những nghệ sĩ các bộ lọc những gì có thể không được sử dụng từ những gì có thể, và làm cho các quyết định actionable.
Trong nhiều cách khác nhau, các phân tích web của cộng đồng đang bị buộc phải học lại những gì khác, cá nhân đã phân tích để tìm hiểu qua nhiều thập kỷ qua. Bán lẻ của nhà phân tích đã phải đưa ra quyết định với các dữ liệu chưa xong. Danh mục phân tích đã phải đưa ra quyết định với các dữ liệu chưa xong. Bây giờ, một thế hệ mới của các nhà phân tích buộc phải đưa ra quyết định với các dữ liệu chi tiết flawed hơn bao giờ hết. Revered nhất của các nhà phân tích trong tương lai sẽ emerge từ quá trình học tập này.
11 tháng chín, 2007 at 08:34
Hầu hết các công việc của tôi đến nay đã được đặt ra với dữ liệu đó được coi là rất đáng tin cậy và không có gì để làm với các trang web, nhưng ngay cả các dữ liệu được đặt ra những terribly messy. Phân tích dữ liệu trên trang web là sẽ khó khăn cho đến khi / trừ khi nó loses anonymity của nó, như là điểm đầu tiên của bạn gợi ý.
Từ đó, thì những thứ khác có thể được tackled và ít nhất một phần đã giải quyết, nhưng thiếu rắn khác biệt giữa các khách truy cập có vẻ như thực tế crutch.
Rất thú vị đăng bai.
11 tháng chín, 2007 at 11:31
Tôi nhìn thấy những thách thức như khoảng hơn mong đợi. Giống như phần còn lại của trang web phân tich, nó thực sự hữu ích tại địa chỉ địa hoá vấn đề, do đó, chấp nhận nó và cho rằng như Avinash thích nói, "get over it" trong phần còn lại.
Mục tiêu của tôi cho Predictive là phân tích để kết thúc với testable giả thuyết. (ví dụ: Những người truy cập tài chính cũng đi đến thể thao. Do đó, nên chúng tôi khuyến khích thể dục thể thao hay cái gì khác?)
Một khi bạn đã và những người bạn tiếp theo thông qua với các thử nghiệm, bạn buộc phải cải thiện hiệu suất.
Vì vậy, thay vì tập trung vào những gì tôi có thể không nhận được, chỉ cần chấp nhận rằng bất cứ điều gì cải thiện tầm nhìn của tôi có thể được giúp đỡ.
Avinash - bạn có cảm giác nhị phân trong tháng này? :-) Predictive phân tích sucks - hay không? Thuê một trường cao đẳng newbie hoặc người có kinh nghiệm? Có lẽ bạn chỉ cần cố gắng để hồi đáp provoke. Well, đoán nó làm việc với tôi - Tôi không thích để có sự lựa chọn bắt buộc.
11 tháng chín, 2007 at 12:35
Actionable nhìn thấy là những cụm từ khoá ở đây! Với công cụ phân tích web hay nhất trên thị trường mà chúng tôi có thể đã được cung cấp trên sâu hơn, và có thêm nhiều variate kiểm tra công nghệ mà chúng tôi có thể đưa nó vào cấp độ khác, ngay cả trước khi chúng tôi cần phải suy nghĩ Predictive. Hầu hết có tổ chức nào được nêu ra để làm chủ một cơ bản hướng optimisation tuệ minh sát, xử lý và không có các nguồn lực để đối phó với các vấn đề về đầu trang mười một cách hiệu quả, do đó, có rất nhiều chi tiết dặm còn lại trong phân tích web. Nếu không có hành động kết quả từ các tuệ minh sát thì những gì đã được điểm? Predictive phân tích sẽ chỉ đến tuổi khi chúng tôi đã chủ động tham gia.
Điều đó nói rằng kinh nghiệm của chúng tôi có một số giá trị trong trang web appending cơ bản để phân tích dữ liệu hồ sơ của khách hàng - nó có thể chắc chắn có cải thiện chiến dịch thư trực tiếp của các kết quả!
Nhiều nhờ kích thích các tế bào xám!
Matthew
11 tháng chín, 2007 at 16:22
Để báo giá JFK Predictive phân tích, chúng tôi xây dựng mô hình để cải thiện các trang web của chúng tôi "không phải vì chúng được dễ dàng, nhưng vì họ đang có khó khăn, vì mục tiêu đó sẽ phục vụ cho tổ chức và biện pháp tốt nhất về năng lực và kỹ năng của chúng tôi, bởi vì đó là một trong những thách thức mà chúng tôi là sẵn sàng chấp nhận, chúng tôi là một trong những unwilling để hoãn, và là một trong những dự định mà chúng tôi giành chiến thắng ":-)
Nếu nó đã được dễ dàng, tất cả mọi người sẽ làm điều đó. Đó là khó khăn. Tuy nhiên, bạn có những dữ liệu về khách hàng của bạn và hành vi của họ (trên web và tắt) là một tài sản quan trọng của bạn không có đối thủ cạnh tranh. Khai khoáng cho nó nhìn thấy và biến những người nhìn thấy dự đoán rằng có thể giúp bạn nhắm mục tiêu và chữa trị cho khách hàng của bạn là phải làm cho các doanh nghiệp tồn tại. Chúng tôi không thể làm điều đó hoàn hảo và có rất nhiều vấn đề (mà bạn có thể rõ ràng articulate) nhưng tôi nghĩ rằng chúng ta phải tiếp tục và tiếp tục cố gắng để cải thiện.
Kiểm tra nhất Mua hoặc MyCoke Phần thưởng - Predictive họ đang sử dụng phân tích và phân tích web kết hợp và nhận được kết quả.
JT
--
Các EDM blog
Blog của tôi ebizQ
Tác giả của thông minh (Enough) Hệ thống
11 tháng chín, 2007 at 23:27
Steve: Giải điểm. Tôi đồng ý với bạn về sự cần thiết để dự đoán lưu lượng truy cập tăng vv nhưng tôi sẽ không để trong danh mục của "Predictive phân tích". Tôi đã giới thiệu cụ thể cho các loại hình phân tích mà té ngã trong khu vực: "này terabyte và xe cho thuê ở đó cho đến khi bạn có thể dự đoán một số lý do tại sao Steve mua từ chúng tôi, những gì anh ta đã ảnh hưởng, và khi anh ta sẽ mua kế tiếp và loại khuyến mãi sẽ làm việc cho anh ta ". Làm điều đó, nhưng ở quy mô.
Nó chứa rất nhiều hứa hẹn cho chúng tôi "dữ liệu whores". Tuy nhiên, trên trang web tôi không nghĩ rằng, đối với bây giờ, mà có thể được cung cấp trên mà trên giấy hứa.
JS: Tôi nghĩ rằng, tôi hơi controversial thừa, là để bây giờ chúng tôi không phải là ngay cả ở một giai đoạn mà chúng ta cần phải lo lắng về việc dữ liệu bị bẩn (và đó là bẩn!). Đó là chi tiết mà chúng tôi đã cơ bản các vấn đề khác được làm việc chống lại chúng tôi. Cho đến khi một số trong những người đi xa và chúng tôi có một số semblance của "ổn định" chúng tôi không phải là đi để có được nhiều cho nỗ lực của chúng tôi.
Tôi tin tưởng rằng điều này sẽ thay đổi. Tôi tự tin rằng chúng tôi sẽ có được một điểm đến khi nó sẽ được giá trị của chúng tôi, trong khi để làm cho nhiều triệu đô la đầu tư trong phần mềm, phần cứng và nhân dân.
Paul: Bạn là Prince Bình luận cho ngày cho báo giá của bạn hoàn toàn brilliant. Tôi sẽ lặp lại nó vì tôi yêu nó rất nhiều: ".. cho tôi những ân huệ để chấp nhận các điều tôi không thể đo lường, các biện pháp can đến những việc tôi có thể, và khôn ngoan để biết sự khác biệt."
Kevin: Đây là loại để bạn chia sẻ thông tin phản hồi của bạn, đặc biệt là bởi vì bạn đã có những thành công tuyệt vời này làm cho rất nhiều công ty. Tôi khuyên bạn nên đánh giá cao blog của bạn, tôi Ngày đó, để bất cứ ai muốn học hỏi từ kinh nghiệm từ những câu chuyện của bạn tại Nordstrom, Eddie Bauer và Lands' End.
Chuck: Tôi hy vọng là cung cấp thức ăn cho người suy nghĩ trước khi quyết định plunk xuống $ 1 triệu hay nhiều hơn trong phần mềm, phần cứng và kỹ năng dựa vào lời hứa của Predictive Analytics. Tôi tìm thấy nhiều trong chúng tôi không thực hiện như là một thông báo khi chúng tôi có thể quyết định có thể. Nó phức tạp, quyết định để thực hiện, nhiều biến, bài đăng này sẽ được chỉ cần một trong các biến tôi khuyến khích bạn thêm vào đó đưa ra các quyết định xử lý.
Liên quan đến các "nhị phân" .... tôi hy vọng, quả thật vậy một trong những "giá trị thương hiệu", là cung cấp cho bối cảnh và bao gồm một vấn đề trong một cách công bằng và cân đối (không phải là loại hình Tin tức Fox!), nhưng cuối cùng để tham gia một cách rõ ràng vị trí và chia sẻ quan điểm trên. Tôi tôn trọng trí tuệ của các độc giả để tạo thành của riêng mình mặc dù số điểm của riêng tôi POV (và các vị trí cung cấp cho người dân để bắt đầu từ cái gì!).
Matthew: 100% đồng ý. Tổng hợp dữ liệu tích hợp vào trang web ngoại tuyến kênh cung cấp lớn có thể nhìn thấy, ngay cả từ đơn giản phân tích, và có rất nhiều để đạt được từ tying hồ sơ của người mua (cho 1% tỷ lệ chuyển đổi) với hồ sơ trực tuyến.
James: Tình yêu và những riff trên JFK báo giá. Tôi đã làm một bản trình bày hôm nay đến Bay Area Tương tác nhóm máy tính con người và tôi đã có một động với hình ảnh của JFK với báo giá: "Yêu cầu không phân tích những gì có thể làm cho bạn, hãy yêu cầu những gì bạn có thể làm cho phân tích ...":)
Tôi phải thừa mà tôi đọc cả các bạn tham khảo các bài viết trong email của bạn và tôi không chắc chắn về cách thức họ là những ví dụ về "Predictive phân tích" trên đầu trang web dữ liệu (tích hợp với các doanh nghiệp hay các dữ liệu khác). Ví dụ: trong khi các ví dụ là mycoke mát nó chỉ đơn giản như nắm bắt thông tin cá nhân của khách hàng và sau đó dựa vào dữ liệu mà họ cung cấp cho bạn công ty sẽ gửi cho các cá nhân cung cấp. Undoubted chương trình lớn, nhưng không phải là một việc sử dụng dữ liệu khai và phân tích trong Predictive đúng ý nghĩa của từ. Như trên cho nhất Mua và MyRewards chương trình.
Tôi đã đăng bài cố gắng bao gồm bất kỳ trang web trên các hành tinh và hàng triệu người dùng nhấp chuột và truy cập dữ liệu, hầu hết là vô danh, nếu không phải là tất cả của nó, và sau đó cố gắng để làm Predictive phân tích trên đó. Tôi nhận thấy một số người dân trên các trang web đó sẽ mua và trong cách chia sẻ dữ liệu của họ và đó là một số giá trị. Tuy nhiên, truyền thống Predictive phân tích được sử dụng trong các từ ngoại tuyến không phải là đầu tư tối ưu nhất. Để có ngay bây giờ. Những điều sẽ thay đổi vì trong khóa học.
Tất cả mọi người: Couple từ chủ đề emerge barrage email tôi đã trao đổi ngày hôm nay (hoàn toàn bất ngờ như vậy cho một chủ đề phức tạp và 1.900 chữ đăng bài!):
1) Có người còn nói: "Nếu bạn làm việc này sau đó bắt đầu nhỏ, hãy xem những gì bạn tìm thấy, nếu nó là actionable sau đó xây dựng trên đó một số chi tiết và sau đó kiểm tra một lần nữa cho actionability. Nếu bạn không tìm thấy mẩu tin lưu niệm actionability sau đó nó và làm những thứ khác. "
2) Có một tấn giá trị tham gia tổng hợp dữ liệu từ các trang web để truy cập mà bạn không biết và nó sẽ hợp nhất các dữ liệu khác của công ty. Số lượt truy cập bạn biết sẽ là những người mua tại trang web của bạn hoặc đăng nhập hoặc tạo ra hồ sơ khách hàng của họ với bạn. Điều này sẽ là một phần trăm nhỏ của khách truy cập, nhưng có thể là chìa khóa learnings đã có.
3) Đôi khi "đủ thông minh" là rất nhiều tốt. (Lấy cảm hứng từ cuốn sách của James!).
Cảm ơn ý kiến của bạn, tôi cảm thấy đặc quyền để có thể có một cuộc hội thoại thông minh với bạn về tất cả các chủ đề phức tạp như vậy.
-Avinash.
12 tháng chín, 2007 at 09:01
Điều này làm cho tôi đăng bài laugh out loud, như tôi nhận thấy rằng có phải được rất nhiều người dân không chỉ cho tôi, yêu cầu bạn các câu hỏi về chủ đề này (tôi thực sự cảm thấy hơi bệnh, mặc dầu ngày hôm nay).
Có một dichotomy giữa touchy cảm thấy thị trường ví dụ như điện thoại di động hàng đầu ra cho các nhà cung cấp đồ nội thất thiết kế để thiết kế cầm tay để có được kết quả người tiêu dùng muốn, và càng có nhiều phản ứng của thị trường khoa học - phân tích web / phân tích, kiểm tra, optimise. Datamining / Predictive phân tích để được xuất hiện tiếp theo evolutionary cho rất nhiều trong giai đoạn phân tích web. Tuy nhiên, nhiều chưa xong / flawed dữ liệu trong các kết quả hoàn toàn chưa xong dự báo. Ngay cả khi / nếu trong tương lai, tất cả các dữ liệu, là gần hoàn hảo, datamining nhiều thậm chí không được hoàn hảo, giải pháp do bản chất của các đối thủ cạnh tranh sân chơi (google vs pony một trong những con người - như là bạn lưu ý).
FT cũng có trong họ đã được viết như thế nào về tất cả các tổ chức tài chính hàng đầu 'Predictive các mô hình đánh giá rủi ro có tất cả hoàn toàn đi ra khỏi cửa sổ, vì điều kiện thị trường / mất mát của họ trong các quỹ hedge được 25 tiêu chuẩn sai xa mức đó là một trong số một triệu cơ (không chính xác những gì nó đã nói gì đó, nhưng như thế). Xem thêm điểm của tôi có được điều kiện thị trường là chìa khóa dẫn đến một Predictive / thống kê của mô hình và nếu chúng tôi dựa vào đó mà không có đầy đủ hiểu biết sai lầm như thế nào chúng có thể được, có thể là hậu quả rất nghiêm trọng và phức tạp - ví dụ như cơ sở giáo dục tình hình tài chính hiện nay.
Cảm ơn rất chu đáo và kịp thời đăng bài!
Marianina, Phân tích web Princess
12 tháng chín, 2007 at 13:34
Avinash,
Là một "phân tích" cho hơn một phần của nghề nghiệp của tôi, đây là một bài viết rất thú vị để đọc. Một trong những điều tôi sẽ nói cho bạn - bạn chắc chắn biết làm thế nào để suy nghĩ và thảo luận provoke :-).
Nói chung, tôi sẽ đồng ý với bạn - cho hầu hết các phần :-). Tôi chắc chắn đồng ý rằng một trong những không nên bơm $ $ $ hoặc nhảy vào Khai khoáng hoặc Predictive Analytics mà không nhận được hành động của họ với nhau trên foundational mặt của Webanalytics. Có rất nhiều vấn đề được đưa vào chăm sóc trước khi đi một trong những digging vào Kho dữ liệu của họ cho 'nhìn thấy'. Some of the key things being (and you mention those in your blog):
a) bạn có nhận biết rằng có một nơi người truy cập và có thể được sử dụng như một chìa khóa để liên kết quay lại các thông tin khác trong kho dữ liệu của bạn.
b) là dạng định dạng cơ bản đủ? Bạn có thể vượt qua một dạng định dạng (nói một số hình thức của người truy cập id) của bạn thông qua thẻ, nhưng sau đó các dữ liệu từ các kênh khác có thể được sử dụng các dạng định dạng khác (nói số tài khoản) - và các mối quan hệ giữa chúng có thể được 1 đến nhiều hay nhiều nhiều, mà có thể tan bạn xác định chính xác từ những người mà nó đã được truy cập trang web của bạn và thực hiện một giao dịch.
c) là thu thập dữ liệu hoàn tất? Về cơ bản, những gì bạn có gắn thẻ và ở những cấp độ.
d) bạn có quyền truy cập vào dữ liệu của bạn? Điều này được nhiều hơn cho những người đang sử dụng nhà cung cấp để lưu trữ các dữ liệu. Predictive và phân tích mẫu sẽ có lợi nếu bạn có cố định và liên tục truy cập vào dữ liệu của bạn.
Tôi hơi ở đâu là không đồng ý với những hình ảnh mà Predictive phân tích là chưa có cho các trang web arena. Tôi nghĩ [và điều này hoàn toàn là của tôi và khăng khăng biased nghĩ :-)] Predictive phân tích (PA) vẫn có thể có ích - nó phụ thuộc vào những gì tất cả các cấp và cho những gì là một trong những bằng cách sử dụng nó cho. Để chắc chắn, PA trong thế giới trực tuyến không thể so sánh với sự phức tạp hoặc sâu sắc, chúng tôi có thể sử dụng nó về ngoại tuyến của chúng tôi không phải là trang web dữ liệu. Tuy nhiên, để lấy ví dụ của bạn ở đâu "... lưu giữa người dân và các kênh liên lạc và có số điểm có thể là một kết quả hoàn toàn khác nhau ở một kênh hơn đã được hầu hết các giao dịch đã được ..", tôi nghĩ rằng PA vẫn có thể được sử dụng để xem có tương tác trong kênh là một trong những kết quả trong một giao dịch khác (Ví dụ tôi có thể nghĩ là một người trông cửa hàng bán lẻ trực tuyến tại để dự đoán hành vi của mình cửa hàng bán hàng).
I also agree that “Tony” and all visits attributed to Tony might not be really Tony. Nhưng nó cũng có thể là những bước đầu tiên để có một số dự đoán hoặc các mẫu nổi cho 'gia đình' hay 'môi trường', nơi Tony được. This brings me to my other point — I think that more than in the offline world, in the online world it is very very critical for the analyst to make some key assumptions around which his analysis is going to revolve and what it should be (and should not be) used for.
And lastly, I again agree with the complexity in isolating various behaviors using clicks. But again, we might learn something by going in the reverse direction — instead of trying to predict what a person is trying to do, why not 'mine' the same behavior across multiple visitors and see if there is something you can improve on your website to increase the conversions on that behavior.
Again, these are my loose thoughts…Overall, I think this is a great thought provoking post and a good read for anyone in the WA community.
And Paul, I too loved your quote on “….the wisdom to know the difference..” :-))
September 14th, 2007 at 12:09
One of things I constantly struggle with as a usability specialist is trying to predict what people want when it's currently not being presented to them as an option. Analytics can really only tell you how people react to what you're already doing. You can test options, track trends, and project those trends into the future, but the one thing the data never tells you is how people would react to something you haven't done.
September 14th, 2007 at 14:14
Dr. Pete : Your comment does go the heart of the issue.
One of the fallacies of predictive analytics (and to some extent all analytics) is that if only we had enough data about our customers (or the world) then we could “predict” anything or create profitable scenarios. Unfortunately that fails exactly at the point you mention.
My best bet at solving for that is to do “site visits” / “follow me homes” of current and potential customers. Effectively “watching them in their native environment without disturbing them too much”.
That observational power, done right, yields lots of insights and problems that the customers have. They will rarely give you solutions, just problems. That's ok because it is our job to think of innovative solutions and the customer's job to give us problems. That's how money is made. :)
As a complement to analytics various qualitative methodologies like lab usability , testing and experimentation , follow me homes etc are a great way to get a great understanding of your customers.
I cover this a lot more in my book but I should write about this in the blog as well.
Thanks so much for the comment.
-Avinash.
September 17th, 2007 at 07:21
Avinash, great post!!! In my opinion the problem is not in data mining and predictive analysis but in:
1- The information is stored in isolated databases and with heterogeneous formats making very difficult to join them.
2- The phrase “You can track all the online information” (that everybody use every time) is true, but it doesn´t mean that is a simple job, actually it is extremely difficult. Web analytics growth with this belief, driving web analytics to an undeveloped situation.
3- Infer over another inference.
If you develop an scenario with not even a minimum of certainty are you gonna be confident about the result? Well, at least I don´t.
I think our main goal must be focusing on moving from isolated and heterogeneous information to centralized and homogeneous one.
So answering to your “Nyet” I would say “???????” (depends) ;-)
September 18th, 2007 at 03:31
The best use I have ever seen of predictve analytics in the web sphere was determining the points at which a buy/no buy decision was potentially being made by the site viewer. Once this had been modelled, and real time data flowed through the model, an applet attached to a live Customer Services Rep would pop up and try to “drag the customer over the line…”
None of this would have been possible without the model output from the predictive analytics
September 28th, 2007 at 02:23
[...] The right answer, as always, is that the amount depends entirely on the return you're generating from your site. Avinash Kaushik refers to connecting your website and your business as “the nonline world.” I like using the “phone bill” model: If your website isn't as valuable to your business as your phone, you're probably not getting the right return yet. But don't assume your phone is more valuable just because your customers call you. They may have gotten the phone number from your website. Or from Google, after it crawled your site. Your website and your phone complement one another, or should in a well-designed small business website. [...]
December 16th, 2007 at 11:32
[...] Avinash Kaushik has a great blog post about trying to do predictive analytics with web data: “Data Mining And Predictive Analytics on Web Data Works? Nyet!” Avinash is one of the truly brilliant minds in web analytics, so it's great to see him put his brainpower behind explaining this assertion. And, it's timely, in light of the new book by Ian Ayres, a Yale Law School professor and econometrician. I really need to order the book and read it, as I've got preconceived notions based on watching an interview with Ayres. [...]
February 27th, 2008 at 02:17
I read your debate with interest. As a lay marketing person helping developing countries to target international companies that have a high probability of expanding their operations beyond their home country (foreign direct investment)I have a tough challenge. Can I use data mining techniques and predictive analytics – using published 'hard' financial data and 'soft' web information – to assess the probability of a company being ready to consider cross-border growth? If so are there any off-the shelf software packages I can use? Any views/advice would be very helpful indeed.
March 13th, 2008 at 16:58
After reading this great article, I was wondering if a GREAT web analyst is one that clearly understand data mining.
March 13th, 2008 at 21:35
Winn : I am not sure that a Great web analyst needs to absolutely understand data mining. Certainly it is a helpful skill.
I would offer this as a “check list”. . . .
Top Ten: Bạn có dấu hiệu A Great phân tích
There are some interesting thoughts in comments on that blog as well.
Hy vọng điều này giúp một chút chút.
-Avinash.
March 14th, 2008 at 05:05
i want to know how to use statistics tools like datamining, statistical significance, correlation etc.. to the seo.
I need numerical examples so that only i can understant how to use the google analytics data and how to evaluate the problems.
if there any tool to compute these data.
Please………..
May 29th, 2008 at 09:25
Points well taken, still there are instances were web mining works well in real life.
Anonymity is an issue; here are some common examples on how web analysts work around the anonymity problem:
a) On a commercial site, web mining can help optimize campaign design/messaging/placement to increase click through rates. Multivariate testing can help optimize many alternative campaign options for completely anonymous users.
b) Tracking anonymous but unique visitors over time can help identify optimal behavior patterns. Allowing personalized online messages for targeting anonymous (but uniquely identified) visitors.
c) Authenticated online purchasers or subscribers are not anonymous. Such groups offer great cross/up sell opportunities via web data mining.
Web mining makes the need for Holistic data even more critical
For CRM, holistic data in needed. Detailed web data is an important component for understanding customer behavior across all touch points. This is easier said than done, but data integration is a tough problem even among offline sources.
June 16th, 2008 at 07:10
I can't contradict even a single detail on this wonderful and very informative post. Avinash is an expert on this kind of industry and he continues to post useful article for its reader. Now, I completely understand the so called Data Mining.
May 4th, 2009 at 11:37
By your post, you are thinking with a classical approach to use DM techniques… but there are too many new possibilities of use DM and predictive modeling from web data… ;-)
A bit more, I´m sure that we are starting a new stage in DM power applications by the amount of web data information.
But the key is not DM or Predictive Analitycs or AI , the question is …for what? : For understand the past, for reduce dimensionality, for predict some KPI's or behavior of the future? ...
How about to use consumer rating product´s with buy propensity or sales projections?
How about real time intelligence engines for sales?
How about to use – in a classical way – for inferencing?
I don´t try to view the world under topics as 'web analyst' or 'data miner' or 'crm analyst'…
I prefer understand the techniques, the business needs and limitations and choose the best way to do.
Giải đăng bai. Cảm ơn
May 12th, 2009 at 15:54
As a statistician, I am inclined to see value in Controlled Studies. By this, I mean the kinds of studies done to see if new drugs are safe and effective, if a particular course curriculum can improve test scores (whatever that means, what ever that indicates) etc etc.
Controlled studies are good because they use a well established and very carefully reviewed process for accounting for all the myriad reasons resulting in a desired response other than the one in which you are interested. The irrelevant factors are removed and only the real results of your program get measured.
Suppose you want to know, using Avinash's example above, if $15 off to the people from Florida does any good. There are a million different reasons why people buy something – you only want to know if your 15 bucks to these people made any difference. (Of course, they really aren't people and we should all be honest about that: they are unique IP addresses, which is another thing all together!) Statistically controlled studies get the real answers and it really works.
Problem is, as far as I can tell, nobody is doing studies comparing a Treated Group with a Control Group. I've never even seen the requisite infrastructure attempted. At least around here (www.marketingassociates.com), that's about to change.
David Corliss
May 22nd, 2009 at 09:11
Your points are well taken; I would like to see an updated post considering the original was from 2007…!
Particularly interesting is your #6 – “Massive Pace of Change on the Web” In my experience, this is where predictive algorithms combined with behavioral targeting succeed on the web. Specifically – assume you want to improve the relevancy of homepage promotions and make sure each promotion resonates with each particular user. KPI = CTR. You develop the creative offers to be included and deploy predictive behavioral targeting javascript to your homepage. As data accumulates, and as more data accumulates, the algorithms develop evolutionary models that begin to associate content with each visitor. As visitor characteristics change, so to does the content that is delivered.
Granted, massive pace and change and the ability to predict outcomes for Amazon.com and nytimes.com are radically different, but there are automated methods available that are effective in improving relevancy and CTR.
Matt,
Website Optimization Manager
Amadesa.com – Website Testing, Personalization and Behavioral Targeting