Theo thống kê của W3Techs, công ty phân tích Internet có trụ sở tại Áo, Tiếng Anh là ngôn ngữ chính của hơn 50% số trang web. Trong khi đó, số người bản ngữ nói tiếng Anh chỉ chiếm dưới 5% dân số toàn cầu.
Tiếng Trung và tiếng Hindi là các ngôn ngữ được sử dụng nhiều thứ hai và thứ ba trên Internet, nhưng chỉ chiếm lần lượt 1,4% và 0,07% tổng số trang web, bằng một phần nhỏ so với tiếng Anh.
Vì sự rộng lớn của Internet, các chuyên gia của W3Techs cảnh báo rằng dữ liệu khảo sát chưa hoàn toàn chính xác và có những điểm mù nhất định. Dù vậy, có thể thấy sự thống trị của tiếng Anh cũng như sự bất bình đẳng sử dụng ngôn ngữ. Các ngôn ngữ như tiếng Bengali và tiếng Urdu, được hàng trăm triệu người nói, gần như không thể tìm thấy trên mạng.
![]() |
Ethnologue, một tổ chức phi lợi nhuận theo dõi việc sử dụng ngôn ngữ, cũng có dữ liệu khảo sát tương tự. Tiếng Anh, tiếng Đức và tiếng Nhật chiếm tỷ trọng lớn trên Internet, không tương xứng với số lượng người bản ngữ nói các ngôn ngữ này. Ngược lại, nhiều ngôn ngữ không thuộc châu Âu hầu như không tồn tại trên Internet.
Sự chênh lệch này là dấu hiệu đáng ngại, thậm chí có thể dẫn đến "tuyệt chủng" một số ngôn ngữ, theo các chuyên gia. Con người có thể đang tiến tới một thế giới chỉ có một số ít ngôn ngữ hiện diện trực tuyến, theo Bhanu Neupane, chuyên gia về bất bình đẳng ngôn ngữ tại UNESCO, nói với Rest of World.
“Sau 15 năm, có thể chỉ còn 5 hoặc 10 ngôn ngữ được nói và sử dụng phổ biến trực tuyến", Neupane cảnh báo.
Các khảo sát của UNESCO cũng nhất quán với các kết quả thống kê của W3Techs. Ngoài tiếng Anh, chỉ có 13 ngôn ngữ khác chiếm được hơn 1% tổng số tên miền. Hàng trăm ngôn ngữ còn lại hiện diện không đáng kể.
Hàng triệu người nói tiếng Anh theo kiểu ngôn ngữ thứ hai, và những người không nói tiếng Anh, có thể gặp khó khăn khi sử dụng Internet.
Ngoài ra, vì văn bản trên Internet thường được sử dụng để đào tạo các mô hình ngôn ngữ lớn như Bard và GPT-4, sự bất bình đẳng hiện nay có thể kéo theo bất bình đẳng trong khả năng tiếp cận và sử dụng công nghệ. Đã có các nghiên cứu cho thấy các mô hình AI hoạt động chính xác hơn đáng kể khi giao tiếp bằng tiếng Anh./.
Tại sao lại có nhiều Internet bằng tiếng Anh?
Không thể hiểu rõ ngay lập tức rằng tại sao lại có khoảng cách ngôn ngữ người dùng nói và nội dung trực tuyến có sẵn. Nó có ý nghĩa rằng tiếng Anh sẽ bắt đầu khá xa trước; lịch sử ban đầu của Internet chủ yếu bắt nguồn từ Hoa Kỳ. Nó đã dự đoán rằng vào năm 1990, 80% nội dung trực được được sử dụng ngôn ngữ Tiếng Anh. Và sau đó thì lượng nội dung Tiếng Anh được giảm đi đáng kể, nhưng vẫn giữ được vị thế với hơn một nửa số nội dung trên internet. Sự thống trị lâu dài của tiếng Anh có thể cho thấy sự thiên vị hơn đối với ngôn ngữ Tiếng Anh trên Internet.
Hầu hết tất cả các công ty lớn nhất trên internet đều ưu tiên tiếng Anh. Google, Amazon và Facebook đều có trụ sở tại Hoa Kỳ, và vì vậy Tiếng Anh luôn là ưu tiên hàng đầu. Điều này không có nghĩa là các công ty internet đã không đạt được những bước tiến để có thể sử dụng các ngôn ngữ trên thế giới. Tuy nhiên, vẫn có những người phải đưa ra quyết định về ngôn ngữ nào đáng để đầu tư tài nguyên.
Có thể xu hướng của các ngôn ngữ trên Internet phản ánh một cách thực tế hơn về các ngôn ngữ trên thế giới. Tiếng Anh là ngôn ngữ chung của nhiều quốc gia. Tiếng Anh chỉ có khoảng 360 triệu người bản xứ, nhưng lại có số lượng người học nhiều hơn bất kỳ ngôn ngữ nào khác. Để tiếp cận thị trường toàn cầu, thì đây là điều cần thiết để có một số hiểu biết về tiếng Anh.
