Help:Controlling search engine indexing/vi

From Linux Web Expert

File:PD-icon.svg Note: When you edit this page, you agree to release your contribution under the CC0. See Public Domain Help Pages for more info.
Some old revisions for this page were imported under CC BY-SA license. Only new contributions are PD.
File:PD-icon.svg

Có nhiều cách khác nhau trong MediaWiki cho phép người dùng cố gắng kiểm soát lập chỉ mục công cụ tìm kiếm, thường được gọi là "noindexing", như vị trí mặc định của các trang được lập chỉ mục. Hầu hết các phương pháp dựa vào việc sử dụng noindex HTML meta tag cho biết các công cụ tìm kiếm không lập chỉ mục một số trang nhất định. Respecting the tag or the robots.txt file, especially in terms of removing already indexed content, is up to the individual search engine, and in theory they may be ignored entirely.

Các phương pháp kiểm soát là:

  1. Kiểm soát toàn bộ không gian tên, thông qua cài đặt phần mềm MediaWiki
  2. Kiểm soát các lớp trang, thông qua MediaWiki:Robots.txt
  3. Kiểm soát các trang riêng lẻ bằng cách thêm __NOINDEX__ từ ma thuật vào chúng, trực tiếp hoặc sử dụng bản mẫu được tạo bao gồm chúng.
  4. Kiểm soát các trang bằng cách thêm từ ma thuật __NOINDEX__ vào các bản mẫu tiêu chuẩn được sử dụng trong một số tình huống nhất định.

Indexing policy set by one of the means above only apply for the page content only. Views that are a part of MediaWiki interface (such as the page history, historical page version or most special pages) are never indexed, irrespective of the settings set above.[1]

Thiết đặt phần mềm và robot.txt

Thiết đặt phần mềm

Toàn bộ không gian tên có thể được noindexed thông qua $wgNamespaceRobotPolicies .

Đồng thời, __NOINDEX__ có thể bị vô hiệu hóa trong một số không gian tên nhất định. Điều này được kiểm soát bởi thiết lập phần mềm MediaWiki $ExemptFromUserRobotsControl, mặc định là $ContentNamespaces.

$wgArticleRobotPolicies có thể được sử dụng để chỉ định các chính sách khác nhau cho các trang riêng lẻ.

Noindex sử dụng Robots.txt

Thông điệp hệ thống MediaWiki:Robots.txt có thể được sử dụng để noindex các trang. Không giống như cài đặt phần mềm, nó có thể được chỉnh sửa trực tiếp.

Từ ma thuật NOINDEX

Các trang riêng lẻ

Các trang riêng lẻ có thể được noindexed bằng cách thêm từ ma thuật __NOINDEX__ vào trang đó. Điều này có thể được thực hiện trực tiếp hoặc sử dụng một bản mẫu được thiết kế để chứa từ ma thuật (ví dụ: {{NOINDEX }}); điều này có thể làm cho việc sử dụng từ khóa dễ theo dõi hơn.

Các trang có từ khóa này được MediaWiki theo dõi và tự động phân loại trong thể loại theo dõi. Tên danh mục được xác định bởi MediaWiki:Noindex-category.

Noindex bản mẫu tiêu chuẩn

Các bản mẫu tiêu chuẩn có thể bao gồm từ khóa __NOINDEX__, có thể được sử dụng để noindexing các trang mà các bản mẫu được áp dụng. Một bản mẫu được sử dụng để đánh dấu một loại trang đặc biệt đồng thời có thể tự động noindex nó.

Từ ma thuật INDEX

Các trang riêng lẻ

Các trang riêng lẻ có thể ghi đè noindexing toàn không gian tên bằng cách thêm từ ma thuật __INDEX__ vào trang đó. Các trang có từ khóa này được MediaWiki theo dõi và tự động phân loại trong thể loại theo dõi. Tên thể loại được xác định bởi MediaWiki:Index-category. Tuy nhiên, INDEX không ghi đè noindexing được áp dụng thông qua MediaWiki:Robots.txt. Nó có thể ghi đè $wgArticleRobotPolicies .

Vấn đề hiện tại

  • phab:T24251 – Từ ma thuật để loại bỏ trang khỏi kết quả tìm kiếm MediaWiki nội bộ

Footnotes