Phân loại người tìm Internet (4 loại)

Việc phân loại các công cụ tìm kiếm internet có thể được chia thành các công cụ tìm kiếm phân cấp, thư mục, công cụ tìm kiếm lai và công cụ tìm kiếm meta.

Công cụ tìm kiếm là một hệ thống phần mềm được thiết kế để tìm thông tin trên World Wide Web. Họ sử dụng các từ khóa để tìm kiếm các tài liệu liên quan đến những từ đó và sau đó đặt kết quả theo thứ tự liên quan đến chủ đề được tìm kiếm.

Các công cụ tìm kiếm Internet tìm cách trích xuất thông tin mà người dùng của bạn yêu cầu; Điều này có thể là do một cơ sở dữ liệu lớn có sẵn trên Internet.

Họ đã trở thành một công cụ sử dụng hàng ngày để tìm kiếm thông tin. Nhờ vào điều này, giờ đây rất dễ dàng tìm thấy thông tin với các công cụ tìm kiếm như Google, AOL, Yahoo và Bing.

Có hàng ngàn công cụ tìm kiếm khác nhau có sẵn trên Internet; mỗi người có khả năng và đặc điểm khác nhau.

Công cụ tìm kiếm đầu tiên được phát triển được gọi là Archie và được sử dụng để tìm kiếm các tệp FTP; công cụ tìm kiếm dựa trên văn bản đầu tiên được gọi là Veronica.

Người dùng có thể truy cập trình duyệt thông qua trình duyệt trên máy tính, điện thoại thông minh, máy tính bảng hoặc thiết bị điện tử khác.

Phân loại các loại công cụ tìm kiếm Internet

1- Người tìm kiếm phân cấp (Spider)

Loại công cụ tìm kiếm này sử dụng một "con nhện" để tìm kiếm các trang web trên Internet. Con nhện này vào các trang web riêng lẻ, lấy ra các từ khóa và sau đó thêm các trang vào cơ sở dữ liệu công cụ tìm kiếm Internet.

Ưu điểm của loại công cụ tìm kiếm này là chúng chứa một số lượng lớn các trang và chúng rất dễ sử dụng. Vì lý do này, người dùng thường tạo ra sự quen thuộc với nó và sử dụng nó nhiều lần.

Mặt khác, những nhược điểm bao gồm bởi vì họ trích xuất quá nhiều dữ liệu, nên rất có thể có quá nhiều thông tin.

Hầu hết các công cụ tìm kiếm phổ biến trên Internet là phân cấp, chẳng hạn như Google, Bing, Yahoo, Yahoo và Yandex.

Tất cả các trình duyệt Internet phân cấp sử dụng bot (spider) để tìm kiếm và lập chỉ mục nội dung mới cho cơ sở dữ liệu tìm kiếm.

Có bốn bước cơ bản mà mỗi công cụ tìm kiếm phân cấp tuân theo trước khi hiển thị bất kỳ trang web nào trong kết quả tìm kiếm:

Trượt

Các công cụ tìm kiếm lướt qua Internet để tìm các trang web có sẵn. Điều này được thực hiện bởi một phần mềm gọi là spider; Tần suất giữa các vụ lở đất có thể mất nhiều ngày.

Chỉ số

Đó là quá trình xác định các từ và thành ngữ mô tả đúng nhất trang web. Các từ được xác định được gọi là từ khóa và trang được gán cho các từ được xác định.

Tính toán mức độ liên quan

Công cụ tìm kiếm so sánh chuỗi tìm kiếm trong chuỗi yêu cầu với các trang được lập chỉ mục của cơ sở dữ liệu.

Bởi vì nhiều khả năng có nhiều hơn một trang chứa chuỗi tìm kiếm, công cụ tìm kiếm bắt đầu tính toán mức độ liên quan của từng trang trong chỉ mục của nó với chuỗi tìm kiếm.

Có một số thuật toán để tính toán mức độ liên quan. Mỗi thuật toán này có trọng số tương đối khác nhau cho các yếu tố phổ biến như mật độ từ khóa hoặc liên kết.

Đó là lý do tại sao mỗi công cụ tìm kiếm đưa ra các trang kết quả khác nhau cho cùng một chuỗi tìm kiếm.

Thỉnh thoảng các công cụ tìm kiếm thay đổi thuật toán của họ.

Lấy kết quả

Về cơ bản, nó chỉ đơn giản là hiển thị kết quả trong trình duyệt; các trang vô hạn của kết quả tìm kiếm được sắp xếp từ phù hợp nhất đến ít quan trọng nhất.

2- Thư mục

Các thư mục là các công cụ tìm kiếm phụ thuộc vào hoạt động của con người cho danh sách của họ: một trang web được trình bày cho thư mục và sự bao gồm của nó phải được nhóm biên tập chấp thuận.

Quá trình này xảy ra như sau:

1-Chủ sở hữu trang web trình bày một mô tả ngắn về trang web của bạn vào thư mục cùng với danh mục cần liệt kê.

2-Trang web đã gửi được xem xét thủ công. Sau đó, nó có thể được thêm vào danh mục phù hợp hoặc nó có thể bị từ chối cho danh sách. Một trang web có nội dung tốt có nhiều khả năng được thêm vào so với một trang web có nội dung kém.

3-Các từ khóa được nhập trong hộp tìm kiếm sẽ được ghép nối với mô tả của trang web. Điều này có nghĩa là những thay đổi được thực hiện cho nội dung của trang web không được xem xét vì chỉ mô tả các vấn đề tương tự.

Ưu điểm là mỗi trang được xem xét về mức độ liên quan và nội dung của nó trước khi được đưa vào. Nhiều lần có ít kết quả hơn có nghĩa là bạn có thể tìm thấy những thứ cần thiết nhanh hơn.

Điều đó nói rằng, định dạng và bố cục không thân thiện với hầu hết mọi người và có thể có vấn đề với các tìm kiếm ít phổ biến hơn. Một nhược điểm khác là có sự chậm trễ trong việc tạo trang web và việc đưa nó vào thư mục

Một số thư mục nổi tiếng bao gồm Dự án Từ điển mở, Thư viện công cộng Internet và DMOZ, gần đây đã đóng cửa.

3- Công cụ tìm kiếm lai

Các công cụ tìm kiếm này sử dụng cả công cụ tìm kiếm phân cấp và thư mục để liệt kê các trang web trong kết quả tìm kiếm.

Hầu hết các công cụ tìm kiếm nhện, như Google, về cơ bản sử dụng các công cụ tìm kiếm phân cấp làm cơ chế chính và giám sát thủ công làm cơ chế phụ.

Đôi khi, người dùng được cung cấp tùy chọn tìm kiếm trên web hoặc một thư mục. Trong các cơ hội khác, người dùng có thể nhận được cả kết quả được chữa khỏi bởi con người và kết quả phân cấp trong cùng một tìm kiếm; khi đây là trường hợp, thông thường kết quả của con người được liệt kê đầu tiên.

Google và Yahoo là hai trong số các công cụ tìm kiếm chính thuộc danh mục này, mặc dù mỗi công cụ tìm kiếm di chuyển đến hệ thống này nhiều hơn.

4- Công cụ tìm kiếm

Các công cụ tìm kiếm Internet này là các công cụ tìm kiếm trong các công cụ tìm kiếm khác cùng một lúc và sau đó kết hợp các kết quả trong một danh sách.

Ưu điểm là thu được nhiều kết quả hơn, nhưng sự liên quan và chất lượng của chúng có thể bị ảnh hưởng đáng kể.

Ví dụ về các công cụ tìm kiếm meta bao gồm Dogpile, Metacrawler và Clusty.