<ins id="fin6x"></ins>

      <small id="fin6x"></small>
      <bdo id="fin6x"></bdo>

    1. http://www.yokohama-feelingclub.com

      使用空白紙測試來優化自然語言處理

      使用空白紙測試來優化自然語言處理

      如果您遞給某人一張空白紙,并且只在頁面的標題上寫明了標題,那么他們會明白標題的含義嗎?
      他們對實際文件可能有一個清晰的想法嗎?如果是這樣,那么恭喜您!您剛剛通過了頁面標題的空白紙測試,因為您的標題具有描述性。

      Ian Lurie多年來一直在談論這個想法,最近在他的新網站上也談到了“ 空白紙測試(BSoPT)”這一想法。這是一項測試,以查看您所寫的內容是否對從未接觸過您的品牌或內容的人有意義。用伊恩的話說:“寫在一張空白紙上的這段文字對陌生人有意義嗎?” 空白紙測試是關于沒有上下文的清晰度。

      但是,如果我們是在一臺機器上而不是一個人上執行BSoPT,該怎么辦?我們的思想實驗仍然適用嗎?我認同。機器無法讀取-甚至是像Google和Bing這樣的復雜機器。他們只能猜測我們內容的含義,這使測試尤為重要。

      我有BSoPT的替代版本,但對于機器來說:如果所有機器都能看到的是文檔中出現的單詞列表以及出現的頻率,它是否可以合理地猜測文檔的含義?

      空白紙測試詞頻

      如果您給某人一張空白的紙,而唯一寫的是這張單詞和頻率表,他們能猜出文章的意思嗎?

      關于磨刀的文章是一個很好的猜測。我從該詞頻表中摘錄的文章是磨刀的方法指南。

      如果表格中出現“步驟”和“如何”一詞怎么辦?讀書的人會更自信這篇文章是關于磨刀還是更少?他們能否說出這篇文章是關于削尖廚房刀還是小刀?

      如果我們不能根據文章使用的單詞來很好地了解文章的含義,那么它將使BSoPT的單詞頻率失敗。

      我們仍然可以將字頻用于BERT嗎?

      搜索引擎采用的早期自然語言處理(NLP)方法使用詞頻和詞共現的統計分析來確定頁面的含義。他們忽略了內容中單詞的順序和詞性,基本上將我們的頁面視為單詞袋。

      我們用于優化這種NLP的工具將我們內容的詞頻與我們的競爭對手進行了比較,并告訴我們詞使用的差距在哪里。假設,如果將這些詞添加到內容中,我們的排名將會更高,或者至少可以幫助搜索引擎更好地理解我們的內容。

      這些工具仍然存在:MarketMuse,SEMRush,seobility,Ryte和其他工具具有某種詞頻或TD-IDF差距分析功能。我一直在使用一個名為Online Text Comparator的免費詞頻工具,它工作得很好。現在,搜索引擎已經使用BERT等NLP方法進行了改進,它們仍然有用嗎?我想是的,但它并不像增加單詞=更好排名那樣簡單。

      BERT比一字不漏的方法要復雜得多。BERT會查看單詞順序,詞性以及內容中出現的所有實體。它功能強大,可以接受培訓以完成許多事情,包括問題回答和命名實體識別-絕對比基本詞頻先進。

      但是,BERT仍需要查看頁面上存在的單詞才能起作用,單詞頻率是該單詞的基本摘要。現在,單詞的位置和詞性更加重要。我們不能只是在頁面的間隙分析中散布我們發現的單詞。

      使用詞頻工具增強內容

      為了使我們的內容對機器毫無歧義,我們需要使它對用戶毫無歧義。減少我們寫作中的歧義是關于選擇與我們正在撰寫的主題相關的單詞。如果我們的寫作中使用了大量的一般動詞,代詞和非主題形容詞,那么我們的內容不僅平淡無奇,而且很難理解。

      考慮以下非特定語言的極端示例:

      “找到合適的廚師刀的訣竅是要在功能,質量和價格之間找到平衡。它應該由足夠堅固的金屬制成,以保持其邊緣相當長的時間。您應該擁有舒適的手柄,不會讓您感到疲勞。您也不需要花費很多。家庭廚師不需要花350美元的日本刀。”

      該副本不是很好。它看起來幾乎是機器生成的。我無法想象這樣寫的全文會通過BSoPT的詞頻。

      這是刪除一些停用詞后的單詞頻率表的樣子:

      現在,假設我們在幾個頁面上使用了詞頻工具,這些詞在“如何挑選廚師的刀”方面排名很高,并且發現這些詞類的使用頻率很高:

      實體:刀片,鋼,疲勞,大馬士革鋼,三德,順(品牌)
      動詞:握柄,切碎
      形容詞:完美,堅硬,高碳

      將這些詞合并到我們的副本中會產生明顯更好的文本:

      “找到完美廚師刀的訣竅是在功能,質量和價格之間取得適當的平衡。刀片應由足夠堅硬的鋼制成,以在重復使用后保持鋒利的邊緣。您應該具有符合人體工程學的手柄,可以舒適地握住手柄,以防止疲勞加劇切碎。您也不需要花費很多。家庭廚師不需要來自順德的350美元的高碳大馬士革鋼santoku。”

      升級后的文本將更易于機器分類,并更好地為用戶閱讀。使用與您的主題相關的單詞也是很好的寫作。

      展望NLP的未來

      是否通過針對BERT或其他NLP算法優化的空白紙測試來改善我們的內容?不,我不這么認為。我認為我們可以添加一些特殊的詞來利用BERT神奇地排名更高。我認為這是確保用戶和機器都能清楚理解我們的內容的一種方式。

      我預計我們已經接近將NLP優化的想法視為荒謬的地步。也許在10年內,由于技術的進步,為用戶編寫文字和為機器編寫文字將是一回事。但是即使那樣,我們仍然必須確保我們的內容有意義。而且空白紙測試仍然是一個很好的起點。

      鄭重聲明:本文版權歸原作者所有,轉載文章僅為傳播更多信息之目的,如作者信息標記有誤,請第一時間聯系我們修改或刪除,多謝。武漢seo

      相關文章閱讀

      女神被啪到深处受不了视频