Theo dõi cúm với các xu hướng dịch cúm của Google

Không có gì đáng ngạc nhiên khi mọi người tìm kiếm thông tin về bệnh cúm khi họ bị bệnh. Google đã tìm ra cách để khai thác xu hướng này và sử dụng nó để ước tính hoạt động của cúm theo vùng. Họ phát hiện ra rằng dữ liệu xu hướng tìm kiếm thực sự nhanh hơn khoảng hai tuần so với phương pháp theo dõi dịch cúm CDC (Trung tâm kiểm soát dịch bệnh) truyền thống.

Google Xu hướng dịch cúm sẽ cung cấp cho bạn ước tính mức độ bùng phát hiện tại ở Hoa Kỳ hoặc phá vỡ trạng thái của tiểu bang. Bạn cũng có thể thấy xu hướng từ những năm trước và tìm kiếm một nơi để tìm thấy những mũi chích ngừa cúm gần bạn.

Dữ liệu lớn

Google Xu hướng Dịch cúm là ví dụ về những khám phá có thể được tạo bằng "dữ liệu lớn", thuật ngữ được sử dụng để mô tả các tập dữ liệu có cấu trúc hoặc không có cấu trúc lớn và quá phức tạp để được kiểm tra bằng các phương pháp truyền thống.

Phân tích dữ liệu truyền thống thường liên quan đến việc giữ những gì bạn thu thập được ở kích thước có thể quản lý. Các nhà nghiên cứu đã sử dụng các mẫu thống kê nhỏ hơn của các nhóm rất lớn để đưa ra các dự đoán thông tin về nhóm lớn hơn. Ví dụ, bỏ phiếu chính trị được thực hiện bằng cách gọi một số lượng tương đối nhỏ của người dân và đặt câu hỏi cho họ. Nếu lấy mẫu giống với nhóm lớn hơn (nói rằng, tất cả cử tri ở Massachusetts), thì kết quả khảo sát của nhóm nhỏ có thể được sử dụng để đoán về nhóm lớn hơn. Bạn cần phải có một bộ dữ liệu rất sạch sẽ và biết những gì bạn đang tìm kiếm.

Mặt khác, dữ liệu lớn sử dụng tập dữ liệu càng lớn càng tốt — giả sử tất cả các truy vấn tìm kiếm trong Google. Khi bạn sử dụng tập dữ liệu lớn, bạn cũng nhận được dữ liệu "lộn xộn": mục nhập không đầy đủ, mục nhập tìm kiếm của mèo đi qua bàn phím, v.v. Tốt rồi. Phân tích dữ liệu lớn có thể tính đến điều này và vẫn kết thúc rút ra kết luận rằng nếu không có thể chưa được tìm thấy.

Một trong những khám phá đó là Google Xu hướng Dịch cúm, có xu hướng tăng đột biến trong các truy vấn tìm kiếm các triệu chứng cúm. Bạn không phải lúc nào Google, "Này, tôi bị cúm. OK Google, bác sĩ ở gần tôi ở đâu?" Bạn có xu hướng tìm kiếm những thứ như "đau đầu và sốt". Xu hướng tăng nhẹ trong một tập hợp các truy vấn tìm kiếm khác rất lộn xộn và lớn là điều mang lại sức mạnh cho Google Xu hướng dịch cúm.

Đây không chỉ là một sự mới lạ vì nó phát hiện các cơn sốt nhanh hơn CDC. CDC dựa vào các xét nghiệm cúm dương tính từ các bác sĩ và bệnh viện. Điều đó có nghĩa là mọi người phải đủ ốm để đi khám bác sĩ với số lượng đủ để gây ra sự tăng đột biến trong xét nghiệm cúm, và sau đó các phòng thí nghiệm phải báo cáo xu hướng. Mọi người sẽ bị bệnh bởi thời gian bạn có thể huy động điều trị.