Tương lai của công nghệ nhà mạng tìm kiếm

ImageHandlerLarge.ashx


Chỉ sau 2 thập kỷ xuất hiện, World Wide Web (Hệ thống mạng toàn cầu hay gọi đơn giản là trang web), với vai trò thúc đẩy việc trao đổi thông tin, giao tiếp, kinh doanh ở khoảng cách xa, đã trở thành công cụ không thể thiếu trong cuộc sống hiện đại. World Wide Web đã tạo ra lượng thông tin khổng lồ trên mạng Internet mở đường cho sự ra đời của các công cụ tìm kiếm. Khi thông tin trở thành hàng hóa, các công cụ tìm kiếm trở thành các cỗ máy kiếm tiền từ các dịch vụ quảng cáo. Những công ty chuyên về dịch vụ tìm kiếm đạt được sự tăng trưởng “thần kỳ” và cũng phải đối mặt với sự cạnh tranh gay gắt để giành được thị phần lớn hơn trong “nền kinh tế tìm kiếm”.


Phát triển cùng với Web

Năm 1995, Tập đoàn Digigal Equipent cho ra đời bộ xử lý siêu tốc Alpha. Louis Monier, nhà nghiên cứu của tập đoàn, đã đề nghị xây dựng một công cụ tìm kiếm có thể tải toàn bộ mạng Internet (cơ sở dữ liệu dung lượng lớn) xuống máy tính tích hợp bộ xử lý Alpha, sau đó tạo ra một chương trình có thể ứng dụng tốc độ xử lý của Alpha. Máy tìm kiếm Alta Vista ra đời. Ngay sau đó, công cụ tìm kiếm của tập đoàn đã đạt được thành công lớn. Những năm 1996-1997, Alta Vista đứng đầu về công nghệ trong lĩnh vực tìm kiếm. Tuy nhiên, chỉ sau đó ít lâu những “gã khổng lồ” mới xuất hiện chiếm chỗ của nó.

Đầu những năm 1990, khi còn là nghiên cứu sinh của ngành tự động hoá thiết kế điện tử, Jerry Yang và David Filo đã mày mò tìm các dữ liệu về bóng rổ trên trang Mosaic. Say mê với công cụ tìm kiếm Yang tạo một trang chủ tên là Akebono, phiên bản đầu tiên của Yahoo! sau này, có chức năng tập hợp dữ liệu va sắp xếp dữ liệu thành những tiểu mục phù hợp với nhu cầu tìm kiếm thông tin. Sau đó, hai nhà sáng lập viên của Yahoo! tách ra khỏi máy chủ của trường, vận động đầu tư và thành lập công ty riêng vào năm 1995.

Công cụ tìm kiếm hoạt động như thế nào?

cau%20truc%20search%20engine%20cua%20Google.bmp

Cấu trúc công cụ tìm kiếm của Google thời kỳ đầu Về cơ bản, một công cụ tìm kiếm gồm ba phần chính có ảnh hưởng quyết định tới chất lượng và tốc độ của mỗi công cụ tìm kiếm: nhện web, hệ thống chỉ mục, hệ thống chạy thực hay bộ xử lý thông tin truy vấn.
Quy trình tìm kiếm trang kết quả bắt đầu với nhện web- một chương trình phần mềm chuyên biệt có thể nhảy từ đường dẫn này sang đường dẫn khác trên Hệ thống mạng toàn cầu (World Wide Web), sau đó thu nhập các trang web được tìm thấy vào hệ thống chỉ mục. Các kết nối tìm thấy trên trang web sẽ được ghi chú lại, sắp xếp và đưa vào các file để tiếp tục gửi đi truy vấn, như vậy với một kết nối mới được tìm ra sẽ có thêm các truy vấn mới và cứ tiếp tục như vậy cho đến vô cùng.
Tại hệ thống chỉ mục, các thuật toán được áp dụng để đưa ra những kết quả phù hợp nhất với truy vấn. Ví dụ Google có thuật toán Chương trình phân hạng trang web phân tích các liên kết tập hợp trên cùng một trang web, các từ neo xung quanh liên kết này và số lượng liên kết ngoài của các trang web, tổng hợp các yếu tố này và tìm ra mức độ phù hợp của một trang web với một truy vấn bất kỳ. Sau khi được phân tích, lưu chỉ mục và đánh dấu, các dữ liệu do nhện web tập hợp lại được đổ vào một hệ thống chỉ mục chạy thực – cơ sở dữ liệu này có thể ngay lập tức cung cấp kết quả tìm kiếm cho người sử dụng.
----------------------------
Goto.com – đi đầu trong thu phí quảng cáo trên số lần kích chuột

Theo phương thức hoạt động này, các nhà quảng cáo chỉ phải trả tiền khi có người truy cập vào mẩu quảng cáo. Khi dịch vụ của Goto.com ra mắt (tháng 6 năm 1998) chỉ có 15 nhà quảng cáo sử dụng. Nhưng trong vòng 6 tháng sau khi ra mắt, và tới năm 1999, con số những nhà quảng cáo lên đến hàng ngàn. Vào thời điểm đó Goto.com phục vụ hơn 100 triệu người tìm kiếm một tháng, với khoảng 10% trong số đó tìm đến kết quả qua những cú kích chuột, hay còn gọi là “những gợi ý được tài trợ”. Tháng 9 năm 2001, Goto.com đổi tên thành Overture phản ánh quan điểm của công ty về mục đích cốt lõi của họ: tạo ra những gợi ý được trả tiền về sản phẩm dịch vụ cho những người truy cập tới trang web khách hàng của họ hay tới hệ thống của những nhà quảng cáo. Vào năm 2003 Overture bị Yahoo! mua lại, hiện nay trang này cung cấp các cơ hội tìm kiếm trả tiền cho các nhà quảng cáo thông qua Yahoo! Search Marketing.


Câu chuyện đến với công cụ tìm kiếm cũng xảy đến tương tự với Sergey Brin và Larry Page, hai sáng lâp viên của Google. Trong dự án nghiên cứu tốt nghiệp họ đưa ra những dự cảm về sự bùng nổ của thông tin trên mạng và nhu cầu về sử dụng dịch vụ tìm kiếm. Mục đích của Google khi đó là giải quyết các vấn đề trên về mặt chất lượng và cả quy mô bằng cách đưa ra công nghệ tìm kiếm cho số lượng tăng lên không ngừng của cả trang web và số lượt truy vấn. Năm 1998, Brin và Page thành lập công ty, sau hai năm đầu khó khăn, họ đạt được sự phát triển đáng kinh ngạc vào những năm tiếp sau.

Khi lượng người truy vấn ngày càng tăng, các công ty chuyên về công cụ tìm kiếm nghĩ tới phát triển các mô hình kinh doanh tài trợ cho các dịch vụ của họ, ví dụ như chương trình trả tiền trên số lần kích chuột của Open Text năm 1996 và Goto.com năm 1998. Google ban đầu chiếm lĩnh sân chơi của các công cụ tìm kiếm khác bằng hình thức tìm kiếm thuần túy trên trang đích. Thậm chí, vào năm 1998, tại hội nghị TED (Kỹ thuật, Thiết kế, Giải trí), Brin và Page đã thẳng thừng từ chối đề nghị hợp tác xây dựng trang tìm kiếm tốt hơn của Bill Gross vì cho rằng Google không bao giờ phối hợp với một công ty tìm kiếm mà cho ra kết quả tìm kiếm lẫn với quảng cáo đã được trả tiền. Tiếp theo đó vào năm 2000, cũng tại hội nghị TED, Brin và Page vẫn tiếp tục từ chối Bill Gross. Nhưng chỉ vài tháng sau cuộc nói chuyện đó, Google đã tung ra AdWords, dịch vụ quảng cáo trực tuyến riêng của mình.

Dịch vụ trả tiền trên số lần kích chuột đã nhanh chóng trở thành phương thức kiếm tiền chính cho các công cụ tìm kiếm. Thị trường này đứng đầu là Google, Yahoo!, Microsoft. Một vài xu cho mỗi lần kích chuột nhưng với quy mô toàn cầu đã đem lại cho những ông vua trong ngành công nghiệp tìm kiếm nguồn doanh thu khổng lồ.

Sự lên ngôi của các công cụ tìm kiếm địa phương

Đi sau những công cụ tìm kiếm được phát triển ở Mỹ, các công cụ tìm kiếm địa phương khai thác thế mạnh xử lý ngôn ngữ địa phương và am hiểu tâm lý người sử dụng. Tại Hàn Quốc, Trung Quốc những công cụ tìm kiếm địa phương như Baidu, Naver, vượt qua Google trở thành công cụ tìm kiếm được sử dụng rộng rãi nhất tại các quốc gia này.

Baidu

Baidu thành lập năm 2000 là công cụ tìm kiếm được biết đến rộng rãi nhất tại Trung Quốc, hiện chiếm 70% thị phần tìm kiếm trực tuyến. Robin Li, đồng sáng lập Baidu, từng theo học tại Đại học Bắc Kinh, một trong những trường đại học hàng đầu của Trung Quốc. Sau đó anh sang Mỹ học về khoa học máy tính tại State University of New York, Buffalo và bắt đầu tiếp xúc với công nghệ tìm kiếm. Li làm việc cho Infoseek, một trong những công ty về công cụ tìm kiếm sớm nhất tại Silicon, trước khi quay trở về Trung Quốc thành lập Baidu cùng với một kỹ sư sinh hóa trẻ tuổi. Công ty niêm yết trên Nasdaq vào tháng 8/2005 với giá trị 27 USD/cổ phiếu.

robin%20li.jpg

Robin Li -người đồng sáng lập trang tìm kiếm Baidu
baidu.jpg

Công nghệ chính của Baidu là tìm kiếm trên web, quảng cáo và nền tảng cho thương mại trực tuyến (e-commerce). Các đối thủ của Baidu gồm có các công ty có trụ sở tại Mỹ cung cấp các dịch vụ tìm kiếm trực tuyến tiếng Trung như Google!China, Yahoo!China và các công ty Internet Trung Quốc như Sina, Sohu, Netease, Tencent.

Chiến lược của Baidu là vẫn tiếp tục duy trì vị trí dẫn đầu thị trường tìm kiếm tiếng Trung bằng cách đưa ra và làm mới các sản phẩm để thu hút và giữ chân lượng lớn người sử dụng và củng cố thương hiệu. Đồng thời, Baidu cũng đang nỗ lực mở rộng thị trường ví dụ như công ty này đã bắt đầu các hoạt động tại Japan vào năm 2008 nhưng vẫn phải cạnh tranh với Yahoo và Google, hai công ty chiếm phần lớn thị phần tìm kiếm tại Nhật Bản.

Tuy nhiên, để giữ được vị trí thống trị của mình, Baidu đối mặt với cuộc cạnh tranh gay gắt từ những nhà cung cấp dịch vụ tìm kiếm như Google và Yahoo! chiếm vị trí quan trọng trên thế giới có nhiều người sử dụng, khách hàng và tiềm lực tài chính hơn Baidu, sức ép phải cung cấp những sản phẩm, dịch vụ mới và mở rộng thị trường, cũng như đối mặt với những cáo buộc về vi phạm bản quyền. Để giữ được thị phần của mình, Baidu sẽ phải tiếp tục đổi mới. Theo báo cáo mới gần đây nhất, công ty đã nhận thấy sự cần thiết phải chi tiêu mạnh tay hơn nữa cho R&D.

Naver

Naver ban đầu là một công ty con của Samsung SDS, ra đời từ ý tưởng cung cấp dịch vụ tìm kiếm tri thức “Knowledge iN”. Vào năm 2001, sau 2 năm thành lập, Naver trở thành một trong ba công cụ tìm kiếm mạnh nhất bên cạnh Daum và Yahoo!. Một năm sau đó, nó vượt qua Yahoo!. Và sau năm 2003, Naver trở thành công cụ tìm kiếm số một tại Hàn Quốc. Vào cuối tháng 6 năm 2007, Naver- ông vua của công nghiệp tìm kiếm tại thị trường Hàn Quốc chiếm 70% thị phần.

Mười năm trước đó, Yahoo!Korea đã đặt chân tới Hàn Quốc và chiếm vị trí quan trọng tại quốc gia này cho tới đầu năm 2000. Empas bắt đầu tấn công vào thị trường công cụ tìm kiếm với khẩu hiệu “Nếu không thể tìm thấy điều bạn muốn với Yahoo, hãy tới Empass”. Khẩu hiệu này nhấn mạnh tới ưu điểm của công cụ tìm kiếm Empass tuy nhiên nó cũng cho thấy sự thống trị của Yahoo! tại thị trường nước này.

Berners Lee – cha đẻ của World Wide Web

Berner%20Lee.jpg
World Wide Web- công cụ máy tính này đã làm thay đổi cuộc sống của mọi người trong hai thập kỷ vừa qua kể từ khi Berners Lee đưa ra phát minh của mình. Nó hỗ trợ tìm kiếm thông tin, giao dịch trực tuyến và giao tiếp qua Email.
Berners Lee sinh năm 1955 tại London. Cha mẹ ông đều là những nhà khoa học tiên phong trong lĩnh vực máy vi tính. Ông học tại trường Queen’s College, Oxford, tốt nghiệp loại ưu về vật lý. Sau khi tốt nghiệp ông là thiết kế phần mềm hợp đồng 6 tháng tại CERN, Phòng thí nghiệm vật lý hạt của Châu Âu tại Thụy Sĩ. Với mong muốn thúc đẩy việc trao đổi thông tin từ máy tính của đồng nghiệp này sang máy tính khác, ông đã viết chương trình Enquire, sau này được phát triển thành World Wide Web. Ông phân chia thành hệ thống HTML bao gồm hệ thống các liên kết siêu văn bản và HTTP hệ thống kết nối từ máy tính này sang máy tính khác. Nói đơn giản, đó là sự giao tiếp thành công giữa HTTP của khách hàng và máy chủ thông qua Internet. Năm 1991, Berner Lee đưa ra trình duyệt World Wide Web với mục đích ban đầu là dành cho người sử dụng tại các cơ sở giáo dục. Nhưng ngay lập tức trang web đã được sử dụng đại trà và góp phần tạo nên cuộc cách mạng thông tin vào cuối thế kỷ XX.


Bước sang thế kỷ 21, Yahoo!Korea trở nên mờ nhạt và bị hạ gục bởi Daum. Công cụ tìm kiếm này nhanh chóng phát triển nhờ có dịch vụ Hanmail (dịch vụ café) đi kèm và chiếm được ngai vàng trong vương quốc dịch vụ tìm kiếm. Tuy nhiên, hào quang của Daum không kéo dài, vị thế này dần nhường lại cho Naver.

Điều gì đã làm nên thành công cho Naver? Nhiều chuyên gia cho rằng đó không hoàn toàn nhờ vào công nghệ. Naver nắm bắt được văn hóa tìm kiếm của những khách hàng trong nước và phản ảnh nó lên các kết quả tìm kiếm, đây là lý do cho sự thành công của Naver. Ví dụ nếu tìm kiếm thông tin về một người nổi tiếng. Naver đưa ra không chỉ các thông tin cá nhân của người này mà còn những tin mới nhất có liên quan, ảnh, các thông tin mà người dùng đưa lên trên mạng “Knowledge iN” và các bài viết liên quan trên blog. Trong khi đó Google chỉ đưa ra một vài trang web và một vài tin có liên quan. Naver nhanh hơn Google trong việc thỏa mãn những câu hỏi tò mò mang nhiều sắc thái của người sử dụng.

Tương lai của công cụ tìm kiếm

Trong tương lai gần, tìm kiếm sẽ được ứng dụng trên nhiều thiết bị. Điều đó đã bắt đầu với máy điện thoại di động và máy PDA, hướng này sẽ còn tiếp tục phát triển theo cấp số nhân, cho tới khi tìm kiếm được xây dựng trên mọi thiết bị số khác trong cuộc sống của chúng ta. Điện thoại, ô tô, ti vi, loa, những thiết bị thấp nhất có gắp chíp điện tử và có khả năng kết nối – tất cả đều sẽ kết hợp lại với nhau thành một hệ thống định vị bằng tìm kiếm.

2mt.jpg

Theo John Battell, tác giả cuốn Công cụ tìm kiếm, bản thân công cụ tìm kiếm đang thay đổi rất nhanh chóng. Công cụ tìm kiếm trong tương lai không thực sự là công cụ tìm kiếm mà chúng ta vẫn hay sử dụng mà sẽ tương đối giống như một đại diện của trí thông minh nhân tạo – hay theo lời Larry Page, “một thủ thư thông thạo mọi nguồn tài liệu tham khảo của toàn bộ tri thức nhân loại”. Hình dung về công cụ tìm kiếm trong tương lai như vậy không chỉ dừng lại ở lãnh địa khoa học viễn tưởng nữa mà đã là mục tiêu trong các tuyên bố của các công ty cung cấp công cụ tìm kiếm như IBM, Microsoft, Google, Yahoo!...

Yandex

yandex.jpg
Công ty thành lập năm 1990. Volozh cùng một vài cộng sự thành lập công ty Comptek cung cấp dịch vụ hệ thống networking và thiết bị viễn thông tại Nga. Công ty phát triển hai hệ thống thông tin: Phân loại các phát minh thế giới, Phân loại sản phẩm và dịch vụ.
Năm 1993, Volozh và các đối tác của công ty Comptek xây dựng công nghệ Yandex tập trung vào tìm kiếm tiếng Nga. Họ hợp tác với Viện Hàn lâm Khoa học Nga để tăng cường khả năng xử lý tiếng Nga: tìm kiếm bằng tiếng Nga khá phức tạp vì ngôn ngữ này có nhiều biến thể phụ thuộc vào mục đích ngữ pháp và ngữ nghĩa. Yandex cho rằng một trong những lợi thế về công nghệ của họ là tự động tìm kiếm tất cả các hình thức biến thể của một từ trong một lần kích chuột tìm kiếm để làm cho việc tìm kiếm trở nên chính xác hơn.
Hiện nay, Yandex là công cụ tìm kiếm số một tại Nga, chiếm khoảng 65% thị phần thị trường tìm kiếm.

Công cụ tìm kiếm thông minh hơn sẽ cho ra những kết quả tìm kiếm thông minh hơn thỏa mãn nhu cầu của những người sử dụng tìm kiếm cụ thể. Ý tưởng ẩn sau tìm kiếm cá nhân là khá đơn giản: công cụ tìm kiếm càng biết nhiều về bạn, nó càng loại bỏ nhiều kết quả không phù hợp với bạn. Ask.com, Google, Microsoft và Yahoo! đã tung ra một số tìm kiếm cá nhân trong năm qua. Hầu hết mọi chuyên gia đều dự đoán sẽ có những đột phá lớn cho ý tưởng này trong tương lai.
NGỌC TÚ tổng hợp

Tài liệu tham khảo:
John Battell, Công cụ tìm kiếm, NXB Tri Thức
David A. Vise và Mark Malseed, Google – Câu chuyện thần kỳ, NXB Tri Thức
Sergey Brin và Lawrence Page, The Anatomy of a Large-Scale Hypertextual Web Search Engine
 
  • Chủ đề
    cách cần dẫn đầu hay hóa kết kết nối liên máy tính nhất nổi tiếng phá phần mềm phát thành thể thế giới thông tin tin tổng hợp tốt triển trụ văn với
  • Top