Thuật toán đối sánh Neural của Google là gì?

Gần đây, Google đã thông báo họ đang sử dụng thuật toán “kết hợp thần kinh” để hiểu rõ hơn về các khái niệm. Danny Sullivan của Google cho biết đang được sử dụng cho 30% truy vấn tìm kiếm.
Gần đây, Google đã xuất bản một bài nghiên cứu kết hợp thành công các truy vấn tìm kiếm với các trang web chỉ sử dụng truy vấn tìm kiếm và các trang web. Trong khi thuật toán này có thể không được sử dụng, hoặc có thể được sử dụng như là một phần của một nhóm các thuật toán, nó phục vụ như là một ví dụ về cách một thuật toán "phù hợp với thần kinh" có thể làm việc.
Thuật toán đối sánh Neural của Google là gì?
Google có sử dụng thuật toán đã xuất bản không?
Google không phải lúc nào cũng sử dụng các thuật toán được xuất bản trong các bằng sáng chế và tài liệu nghiên cứu. Tuy nhiên, một số lượng không xác định các thuật toán được xuất bản thực sự được sử dụng trong thuật toán tìm kiếm của Google .

Cũng phải nói rằng Google thường không xác nhận liệu một thuật toán cụ thể có đang được sử dụng hay không.

Google thảo luận về thuật toán AI mới
Google có trong quá khứ đã thảo luận các thuật toán theo thuật ngữ chung, chẳng hạn như thuật toán Panda và thuật toán Penguin. Và điều này có vẻ là trường hợp ngày hôm nay, như Danny Sullivan giảm manh mối về thuật toán "phù hợp với thần kinh" mới này.

Thuật toán mới này đã được thảo luận bởi Danny Sullivan ( trong một tweet ) như là một:
“… Phù hợp với thần kinh, phương pháp –AI để kết nối tốt hơn từ với khái niệm.”\ 
“Cách mọi người tìm kiếm thường khác với thông tin mà mọi người viết giải pháp.”
AI, Các trang học tập và xếp hạng sâu
Blog AI của Google gần đây đã xuất bản liên kết tới một bài nghiên cứu mới được gọi là Xếp hạng mức độ liên quan sâu bằng cách sử dụng Tương tác truy vấn tài liệu nâng cao . Mặc dù nghiên cứu thuật toán này là tương đối mới, nó cải thiện trên một phương pháp mạng thần kinh sâu mang tính cách mạng để hoàn thành một nhiệm vụ được gọi là Xếp hạng Tài liệu Liên quan. Phương thức này còn được gọi là Ad-hoc Retrieval.

Trong khi nó không thể nói dứt khoát rằng đây là một phần của những gì Google gọi Neural Matching, nó làm cho nghiên cứu thú vị về một cái gì đó là tương tự như vậy.

Đây là cách nghiên cứu mới mô tả cách truy xuất đặc biệt:
“Xếp hạng mức độ phù hợp của tài liệu, còn được gọi là truy xuất đặc biệt… là nhiệm vụ xếp hạng tài liệu từ một bộ sưu tập lớn sử dụng truy vấn và văn bản của từng tài liệu”.
Bài nghiên cứu rõ ràng, rằng hình thức xếp hạng này chỉ sử dụng truy vấn tìm kiếm và trang web. Nó tiếp tục nói:
“Điều này trái ngược với các hệ thống thu hồi thông tin tiêu chuẩn (IR) dựa trên các tín hiệu dựa trên văn bản kết hợp với cấu trúc mạng (Page et al., 1999; Kleinberg, 1999) và / hoặc phản hồi của người dùng (Joachims, 2002).”
Trong tuyên bố trên, nó nói rằng Xếp hạng liên quan đến tài liệu khác với các công nghệ tìm kiếm khác (hệ thống truy xuất thông tin) dựa vào “cấu trúc mạng” và sau đó nó trích dẫn Larry Page, đây là tham chiếu đến PageRank và các liên kết. Nó cũng trích dẫn Kleinberg, đó là một tài liệu tham khảo để nghiên cứu Jon Kleinbergs về cách sử dụng các liên kết để xếp hạng các trang web .

Rõ ràng là Xếp hạng liên quan đến tài liệu là một phương pháp tương đối mới để xếp hạng các trang web và nó không dựa vào các tín hiệu liên kết.

Bảng xếp hạng liên quan đến tài liệu của Google có sử dụng liên kết không?
Các alorithm mới được xuất bản trong blog AI của Google không trực tiếp sử dụng các yếu tố xếp hạng truyền thống. Tuy nhiên, các yếu tố xếp hạng truyền thống được sử dụng trước tiên. Sau đó, phần truy xuất Ad-hoc của thuật toán được sử dụng.

Điều này có nghĩa là bất kỳ tín hiệu xếp hạng nào có trang web phải nhảy qua để xếp hạng vẫn tồn tại. Tuy nhiên, các tín hiệu xếp hạng truyền thống không xác định những trang nào sẽ xếp hạng trong top ten.

Vì vậy, có thể nói rằng các tín hiệu xếp hạng truyền thống phục vụ một loại chức năng kiểm duyệt. Các tín hiệu xếp hạng loại bỏ các thư rác và thu thập các tài liệu có liên quan nhất.

Thuật toán mới này làm gì là xếp hạng lại các trang web đó theo một bộ tiêu chí khác cho phù hợp với những gì Danny Sullivan gọi là "Siêu từ đồng nghĩa".

Và điều này sử dụng các tín hiệu xếp hạng đầu tiên là những gì làm cho thuật toán này khác với thuật toán được xuất bản vào năm 2016, được gọi là Mô hình đối sánh mức độ liên quan sâu (DRMM).

Đây là những gì nghiên cứu mới cho biết, khi so sánh DRMM với thuật toán mới này:
“Trong mô hình dựa trên tương tác, các mã hóa rõ ràng giữa các cặp truy vấn và tài liệu được tạo ra. Điều này cho phép mô hình hóa trực tiếp các thuật ngữ chính xác hoặc gần đúng (ví dụ: các từ đồng nghĩa), điều này rất quan trọng đối với xếp hạng mức độ liên quan.
Thật vậy, Guo et al. (2016) cho thấy DRMM dựa trên tương tác tốt hơn so với các phương pháp dựa trên đại diện trước đó. Mặt khác, các mô hình dựa trên tương tác kém hiệu quả, vì người ta không thể lập chỉ mục một biểu diễn tài liệu độc lập với truy vấn. Tuy nhiên, điều này ít quan trọng hơn khi phương pháp xếp hạng mức độ liên quan kiểm soát lại các tài liệu hàng đầu được trả về bởi một công cụ IR thông thường, đó là kịch bản mà chúng tôi xem xét ở đây ”.
Thuật toán thực sự làm gì?
Mục đích của thuật toán là đối sánh truy vấn tìm kiếm với trang web, chỉ sử dụng truy vấn tìm kiếm và chính trang web đó. Các trang web được xếp hạng theo loại thuật toán này sẽ không được thăng cấp lên các vị trí hàng đầu nhờ vào các liên kết hoặc từ khóa, vì loại thuật toán này là về "sự liên quan phù hợp".
“Chúng tôi khám phá một số mô hình mới về xếp hạng mức độ liên quan đến tài liệu, xây dựng dựa trên Mô hình kết hợp liên quan sâu (DRMM)… Không giống DRMM, sử dụng các bảng mã ngữ cảnh nhạy cảm và truy vấn tài liệu truy vấn. , lấy cảm hứng từ tính năng kết hợp n-gram của PACRR (Hui và cộng sự, 2017), nhưng được mở rộng theo nhiều cách bao gồm nhiều chế độ xem truy vấn và đầu vào tài liệu. ”
Nội dung quan trọng hơn
Điều này có nghĩa là nhà xuất bản nên sử dụng nhiều từ đồng nghĩa hơn? Việc thêm từ đồng nghĩa dường như luôn là biến thể của spam từ khóa. Tôi luôn coi đó là một gợi ý ngây thơ.

Mục đích của Google hiểu các từ đồng nghĩa đơn giản là hiểu ngữ cảnh và ý nghĩa của một trang. Giao tiếp rõ ràng và nhất quán, theo ý kiến ​​của tôi, quan trọng hơn là gửi spam một trang có từ khóa và từ đồng nghĩa.

Những gì Google đã chính thức tuyên bố là nó có thể hiểu được các khái niệm. Vì vậy, trong một cách, mà đi xa hơn chỉ là từ khóa và từ đồng nghĩa. Đó là một sự hiểu biết tự nhiên hơn về cách một trang web giải quyết được vấn đề ngụ ý trong một truy vấn tìm kiếm. Theo thông báo chính thức của Google :
“… Bây giờ chúng ta đã đạt đến điểm mà các mạng thần kinh có thể giúp chúng ta tiến một bước nhảy vọt lớn từ việc hiểu các từ để hiểu các khái niệm. Các phần mở rộng thần kinh, một cách tiếp cận được phát triển trong lĩnh vực mạng thần kinh, cho phép chúng ta biến đổi các từ thành các biểu diễn mờ của các khái niệm cơ bản, và sau đó kết hợp các khái niệm trong truy vấn với các khái niệm trong tài liệu. Chúng tôi gọi kỹ thuật này là khớp thần kinh. ”
Đây có phải là Neural Matching không?
Có thể là sự kết hợp thần kinh có các thành phần của thuật toán này trộn lẫn với các phần tử của các thuật toán khác. Liệu Google có sử dụng thuật toán chính xác này ít quan trọng hơn việc hiểu rằng các tài liệu xếp hạng chỉ sử dụng truy vấn tìm kiếm và nội dung trang web là có thể.

Hiểu được điều này sẽ giúp nhà xuất bản tránh quay bánh xe bằng các chiến lược không hữu ích như thêm từ đồng nghĩa.

Loại xếp hạng AI mới này cho thấy cách có thể tạo kết quả tìm kiếm không được xếp hạng trực tiếp bởi các yếu tố xếp hạng truyền thống như liên kết hoặc từ khóa. Và điều này đòi hỏi sự chú ý gần hơn đến những thứ như mục đích của người dùng và hiểu cách một trang nội dung giúp người dùng.

Mời các bạn viết lời bình cho bài viết!

Nhấp bài bình luận SEO