Google vô tình làm rò rỉ 2500 trang tài liệu mật

Mới đây, Google đã xác nhận việc tài liệu nội bộ dài 2.500 trang bị rò rỉ chứa đầy thông tin về dữ liệu mà công ty thu thập là sự thật.Trước đó, Google đã từ chối bình luận về tính xác thực của các tài liệu này.

Tài liệu rò rỉ có tiêu đề "Google API Content Warehouse" chứa thông tin liên quan đến API nội bộ và giải thích những yếu tố, và thành phần nào ảnh hưởng đến kết quả tìm kiếm.

Trong đó, bao gồm một số thông tin cũ và mới. Người dùng có thể tham khảo sơ bộ tài liệu bị rò rỉ của Google để biết điều gì nên làm và điều gì không.

Sự nhầm lẫn này của Google được đưa lên GitHub vào ngày 27/3. Sau đó nó đã bị thu hồi hoặc xóa vào ngày 7/5. Tuy nhiên, do việc lập chỉ mục được thực hiện bởi dịch vụ của bên thứ ba nên một bản sao của tài liệu Google bị rò rỉ vẫn còn có sẵn.

Google vô tình làm rò rỉ 2500 trang tài liệu mật. Ảnh minh họa

Google vô tình làm rò rỉ 2500 trang tài liệu mật. Ảnh minh họa

Các chuyên gia tối ưu hóa công cụ tìm kiếm (SEO) Rand Fishkin và Mike King là những người đầu tiên biết đến sự tồn tại của tài liệu rò rỉ, và họ đã công bố các phân tích ban đầu về nội dung của chúng vào đầu tuần này.

Tài liệu rò rỉ tiết lộ rằng Google thu thập và có thể sử dụng dữ liệu mà các đại diện của công ty từng nói là không đóng góp vào việc xếp hạng các trang web trên Google Tìm kiếm như lượt nhấp, dữ liệu người dùng Chrome,...

Hàng nghìn trang tài liệu này hoạt động như một kho thông tin cho nhân viên Google, nhưng không rõ những dữ liệu cụ thể nào thực sự được sử dụng để xếp hạng nội dung tìm kiếm, bởi thông tin có thể đã lỗi thời, chỉ được sử dụng cho mục đích đào tạo hoặc được thu thập nhưng không dùng riêng cho Google Tìm kiếm.

Các tài liệu cũng không làm sáng tỏ cách các yếu tố khác nhau được đánh giá trong quá trình tìm kiếm, nếu có.

Tuy nhiên, thông tin được công khai này có khả năng gây ra những ảnh hưởng đáng kể đối với ngành tối ưu hóa công cụ tìm kiếm (SEO), tiếp thị và xuất bản.

Google thường rất kín tiếng về cách thức hoạt động của thuật toán tìm kiếm của mình, nhưng những tài liệu này — cùng với lời khai gần đây trong vụ kiện chống độc quyền của Bộ Tư pháp Hoa Kỳ — đã cung cấp thêm thông tin rõ ràng về những tín hiệu mà Google đang xem xét khi xếp hạng các trang web.

Những lựa chọn của Google về tìm kiếm có tác động sâu sắc đến bất kỳ ai dựa vào web để kinh doanh, từ các nhà xuất bản nhỏ độc lập đến các nhà hàng đến các cửa hàng trực tuyến. SEO từ lâu đã trở thành một ngành công nghiệp, nhưng không phải ai cũng dám tự tin khẳng định mình biết mọi thứ về SEO, khi Google luôn kín tiếng về cách thuật toán của mình hoạt động. Những tài liệu bị rò rỉ này ít nhiều đã cho chúng ta thấy cách Google vận hành bộ máy tìm kiếm của mình, nên nó không khác gì một "mỏ vàng" cho dân SEO.

Theo Đời sống
back to top