thinhle@tlnet.com.vn
Các công cụ tìm kiếm trên web
Trình duyệt Web được sử dụng để truy nhập thông tin từ Site này sang Site khác và những liên kết tiếp theo sẽ cung cấp nhiều thông tin hơn về vấn đề bạn đang quan tâm.
Việc tìm kiếm trên Web bao gồm việc tìm một Site đặc thù hoặc một thông tin chuyên biệt nào đó. Vậy làm thế nào để tìm kiếm hàng triệu trang Web trên Internet?
Vấn đề trên có thể giải quyết được thông qua các công cụ tìm kiếm (Search Engine). Chúng được thiết lập dựa trên một kỹ thuật cơ bản quét liên tục trên Internet, chỉ mục của các Site, các trang Web và những loại thông tin khác.
Khi đã hiểu được cách thức sử dụng các công cụ tìm kiếm, bạn có thể sử dụng kỹ thuật tương tự để tìm cơ sở dữ liệu ở nhiều trang Web khác nhau.
Khi dùng một công cụ tìm kiếm, bạn phải nhập các từ khóa vào trong hộp tìm kiếm. Khi đó, công cụ tìm kiếm sẽ đưa ra một danh sách gồm các hits, cung cấp liên kết tới những nơi có chứa từ khóa của bạn trên Internet. Hầu hết các công cụ tìm kiếm đều cho phép sử dụng miễn phí.
Từ khóa là những từ hoặc cụm từ mô tả thông tin bạn muốn tìm. Chúng có thể là tên công ty, tên người, hoặc tên chủ đề.
- Các công cụ tìm kiếm thông dụng
- http://www.excite.com/ Excite: Là một công cụ tìm kiếm cung cấp cho bạn hơn 50.000.000 trang Web và nhiều thông tin liên quan khác.
- http://www.altavista.com/ Altavista: Tại Website này bạn có thể tìm thấy hơn 30.000.000 trang Web khác nhau và các công cụ tìm kiếm từ đơn giản đến cao cấp.
- http://www.hotbot.com/ Hotbot: Cung cấp thông tin của hơn 54.000.000 trang Web và các Newsgroups khác nhau.
- http://www.infoseek.com/ Infoseek: Hỗ trợ tìm kiếm thông tin thông qua hơn 1.500.000 trang Web cũng như các Newsgroups, các địa chỉ E-mail và các thắc mắc thường hỏi (FAQs) trên trang Web.
- http://www.lycos.com/ Lycos: Cung cấp phạm vi tìm kiếm lên đến 66.000.000 trang Web. Bên cạnh việc tìm kiếm theo văn bản, bạn cũng có thể tìm kiếm những file Web có hình ảnh và âm thanh.
- http://www.mckinley.com/ Magellan: Bao gồm rất nhiều lĩnh vực khác nhau. địa chỉ này cung cấp các chỉ dẫn về giá cả, các bài xã luận và bình luận.
- http://www.webcrawler.com/ Webcrawler: Với chỉ mục khoảng hơn 2.000.000 trang Web, địa chỉ này cung cấp các bài bình luận và xã luận chọn lọc tổng hợp từ nhiều trang Web khác nhau.
- http://www.yahoo.com/ Yahoo: Cung cấp khoảng 400.000 trang Web được đánh chỉ mục bằng tay nên cung cấp nhiều trang thông tin liên kết có chất lượng cao. Trang Web này cung cấp cho bạn những thông tin phong phú về du lịch và một số thông tin khác.
- Các công cụ tìm kiếm chuyên biệt
- http://www.metacrawler.com/ MetaCrawler: Hỗ trợ việc tìm kiếm các công cụ tìm kiếm khác tại cùng một thời điểm. Địa chỉ này giúp tìm kiếm thông qua 9 trang Web bao gồm: Excite, Lycos và WebCrawler.
- http://www.four11.com/ Four11: Đây là một dịch vụ White Pages hỗ trợ bạn tìm kiếm thông tin liên lạc với mọi người. Sử dụng 411 để tìm các địa chỉ E-mail và số điện thoại.
- http://www.dejanews.com/ DejaNews: Cung cấp thông tin hơn 2.000 Newsgroups.
Lưu ý: Nếu các công cụ tìm kiếm trên trang Web không đánh chỉ số các trang, thì đòi hỏi người dùng phải nhập vào một mật khẩu (password). điều này có nghĩa là thông tin nóng hoặc có giá trị cần phải trả chi phí và đây chính là lý do vì sao bạn không thể lấy được thông tin từ lời nói, tiêu đề của các bài báo ở trang Web của tờ The New York Times ở địa chỉ: http://www.nytimes.com