Định nghĩa thuật toán Twitter

Cách Twitter's Computers Đọc Tweet

Định nghĩa:

Những người thông minh tại Twitter đã tập hợp một thuật toán siêu phức tạp để các máy tính thông minh của họ biết cách "đọc" các tweet gazillion mà họ đang đẩy qua firehose.

Thuật toán, bất kỳ thuật toán nào, được sử dụng để xử lý dữ liệu, thường đưa chúng vào các nhóm sẽ đưa ra kết luận cuối cùng. Ví dụ: khi bạn tìm kiếm thứ gì đó trong Google hoặc Bing, các kết quả tìm kiếm được trả lại cho bạn đến từ một thuật toán.

Thuật toán của công cụ tìm kiếm xác định rằng những gì bạn muốn, dựa trên tìm kiếm của bạn, là những gì họ tiết lộ cho bạn.

Thuật toán của Twitter, đọc và sắp xếp Tweets, cho phép Twitter tìm ra những gì đang xảy ra ở bất cứ đâu.

Ví dụ, khi Michael Jackson qua đời, cái chết của anh đã đánh dấu cái đầu tiên, sau đó là hai, rồi bốn, sau đó là sáu trong mười chủ đề thịnh hành chiều hôm đó. Và, đó là hai mươi phút trước khi đài tin tức phát thanh địa phương báo cáo.

Vào cuối mỗi năm, Twitter xuất bản một trang Tweets vàng để hiển thị Tweets được tweet lại nhiều nhất trong năm. Đó là dữ liệu họ sẽ không bao giờ có thể phân tích cú pháp mà không có một thuật toán cụ thể có nghĩa là để đếm những tweet đó.

Khi Twitter lần đầu tiên tiết lộ tab Khám phá mới, họ đã viết về thuật toán được sử dụng để xây dựng nó:

"Chúng tôi đang bắt đầu giới thiệu một phiên bản mới của tab Khám phá được cá nhân hóa hơn cho bạn. Chúng tôi đã cải thiện các thuật toán cá nhân hóa của chúng tôi để kết hợp một số tín hiệu mới bao gồm cả các tài khoản bạn theo dõi và người mà họ theo dõi. được sử dụng để hiểu sở thích của bạn và hiển thị những câu chuyện có liên quan đến bạn trong thời gian thực.

Đằng sau hậu trường, tab Khám phá mới được cung cấp bởi Earlybird, công nghệ tìm kiếm thời gian thực của Twitter. Khi người dùng tweet, Tweet đó được lập chỉ mục và có thể tìm kiếm trong vài giây. Mỗi Tweet có liên kết cũng trải qua một số xử lý bổ sung: chúng tôi trích xuất và mở rộng mọi URL có sẵn trong Tweet và sau đó tìm nạp nội dung của các URL đó qua SpiderDuck, trình tìm nạp URL thời gian thực của chúng tôi.

Để tạo ra những câu chuyện dựa trên biểu đồ xã hội của bạn và chúng tôi tin rằng điều thú vị nhất đối với bạn, trước tiên chúng tôi sử dụng Cassovary, thư viện xử lý biểu đồ của chúng tôi để xác định các kết nối của bạn và xếp hạng chúng theo mức độ mạnh mẽ và quan trọng của các kết nối đó với bạn.

Khi chúng tôi có mạng đó, chúng tôi sử dụng công cụ tìm kiếm linh hoạt của Twitter để tìm các URL đã được chia sẻ bởi vòng kết nối đó. Các liên kết đó được chuyển thành các câu chuyện mà chúng tôi sẽ hiển thị cùng với các câu chuyện khác trong tab Khám phá. Trước khi hiển thị chúng, một bảng xếp hạng cuối cùng xếp hạng lại các câu chuyện theo số người đã tweet về chúng và mức độ quan trọng của những người đó liên quan đến bạn. Tất cả điều này xảy ra trong thời gian gần thực, có nghĩa là các câu chuyện phá vỡ và có liên quan xuất hiện trong tab Khám phá mới gần như ngay khi mọi người bắt đầu nói về chúng. "

Hầu hết các doanh nghiệp có thuật toán xử lý tấn dữ liệu mỗi ngày. Các thuật toán được cập nhật thường xuyên khi cần. Ví dụ, trong vài năm qua, Google đã cập nhật thuật toán tìm kiếm của họ (với sự mất tinh thần của SEO ở khắp mọi nơi) một tấn thời gian. Những gì bạn nhận được như một kết quả tìm kiếm ngày hôm nay cho bất kỳ tìm kiếm nhất định là rất khó để những gì bạn đã có thể tìm thấy năm trước đây.

Các thuật toán tìm kiếm của Twitter cũng đã trở nên cực kỳ năng động. Bạn có thể tìm thấy những người đặc biệt đặt câu hỏi, người sử dụng khuôn mặt cười trong Tweet của họ và những người đang Tweeting cụ thể ở vị trí địa lý của bạn.

Thuật toán của Twitter không cần phải tích cực như Google, nhưng nó chắc chắn mạnh mẽ và được sử dụng hiệu quả để tạo ra các cách mới để xem dữ liệu hiện có của Twitter.

Lỗi chính tả phổ biến:

twitter algorythm
algorythm