百度目前在站內搜索中支持5個數據模板的提交,分別是:通用、影視、小說、游戲、論壇。在實際的工作中處理過2個,所以分享下這2個的處理方法。 1、按照慣例,百度的這個提交是需要用xml地圖集的形式,先來說說游戲模板
<?xml version=”1.0″ encoding=”UTF-8″?> |
備注 |
<urlset> |
|
??? <url> |
|
??????? <loc>http://www.880sy.com/games/64929.html#gid.html</loc> |
著陸頁 |
??????? <lastmod>2013-01-01</lastmod> |
文件一次更新時間 |
??????? <data> |
|
??????????? <name>*</name> |
游戲名稱 |
??????????? <url><![CDATA[http://www.880sy.com/games/64929.html#gid.html]]></url> |
著陸頁 |
??????????? <gameCategory>移動游戲</gameCategory> |
可根據tag調整 |
??????????? <gameSubCategory>手機游戲</gameSubCategory> |
可根據tag調整 |
??????????? <description>《魔獸》(World of Warcraft)…</description> |
測試下來,站內搜索展示前140個字符正好,如果沒有字符,別忘了要技術寫個判斷加上些類似“暫無介紹”的文字,不然會報錯 |
??????????? <image> |
|
??????????????? <name>*圖標</name> |
可以是圖片的alt標簽 |
??????????????? <url><![CDATA[http://xxxxx.xxx.jpg ]]> </url> |
游戲的展示圖片,例如手游的話是app圖標 |
??????????? </image> |
|
??????????? <datePublished>2011-12-20</datePublished> |
游戲的發布時間 |
??????????? <size>*MB</size> |
游戲大小 |
??????????? <tag>RPG,射擊</tag> |
游戲類型,這個可以根據站點的tag標簽調整 |
??????????? <developer><legalName>*</legalName></developer> |
開發商 |
??????????? <version>V2.4.0</version> |
版本號 |
??????????? <device>*</device> |
設備類型 |
??????? </data> |
|
??? </url> |
|
</urlset> |
|
<downloadUrl><![CDATA[ http://www.wowchina.com]]></downloadUrl> |
地址,有的話放上去,不是必填項 |
其他注意點:整個文檔要字符串形式, 這種需要轉義,自己注意。文件量太大的話用sitemapindex索引的xml。提交后很快能在百度站內搜索中看到結果。
? 這部分需要到樣式自定義里面去把游戲樣式調用出來。
? 2、通用模板樣式
<?xml version=”1.0″ encoding=”UTF-8″?> |
備注 |
<urlset> |
|
??? <url> |
|
|
??????? <loc>http://ky.kaoyan.com/04/467393/</loc> |
|
著陸頁 |
??????? <lastmod>2013-04-10</lastmod> |
|
更新時間 |
??????? <changefreq>always</changefreq> |
|
更新平率 |
??????? <priority>0.5</priority> |
|
重要值 |
??????? <data> |
|
|
??????????? <display> |
|
|
??????????????? <title>【寫給即將上戰場的你們】努力為王,心態為皇</title> |
|
文章標題,建議用頁面的title格式 |
??????????????? <content>略</content> |
|
可以全部提交正文,不用等蜘蛛來抓取了,注意把圖片格式,鏈接格式全部去掉 |
??????????????? <tag>考研復習</tag><tag>經驗</tag> |
|
根據tag標簽 |
??????????????? <pubTime>2012-12-04T11:20:13</pubTime> |
|
發布時間 |
??????????????? <breadCrumb title=”考研加油站” url=”http://ky.kaoyan.com/”/> |
|
相當于面包屑的層級關系 |
??????????????? <breadCrumb title=”考研政治” url=”http://www.kaoyan.com/s/zhengzhi”/> |
|
??????????????? <thumbnail loc=”http://docs.kaoyan.com/jpg/12/1204dde3cd949ccc.jpg”/> |
|
縮略圖 |
??????????????? <image loc=”http://docs.kaoyan.com/jpg/12/12048543278e760d.jpg” title=”七個常用的泰勒展開式”/> |
|
文章的個圖片,默認缺省的話會調用縮略圖 |
??????????? </display> |
|
|
??????? </data> |
|
|
??? </url> |
|
|
</urlset> |
|
下圖是通用模板的自定義結構化因子,可以增加展示整個通用模板里還有很多其他的信息。在其中還可以看到比如discount(折扣);price(價格)等影響的因素。有興趣的可以去研究整個通用模板的數據結果,都包含在里面。
下圖的面包屑的層級是用breadcrumb:title這個結構因子產生出來的。并且終還可以根據你的這些標簽(比如price)進行排序。 
說說重點的地方: 1、希望哪,這些提交的內容能在百度搜索引擎(不是自己的站內)結果展示上有一定的區別。
2、貌似阿拉丁百度開放平臺里提交的數據和這個有些像,之后研究下,可以的話提交行業數據試試。
推薦閱讀
增加瞬時站內搜索流量 尋找新聞熱點方面的總結 @steven | 文軍營銷2、發布完后隔一段時間需要有人總結搜索的關鍵詞,另外開一篇文章總結,進行再次站內的發酵(甚至可以的概括,以這次的翻譯為例子,比如說美國隊長翻譯錯誤的總結,鋼鐵俠翻譯錯誤的總結等) 3、篇熱點結束后在站外發布并留下鏈接,帶上品牌(站外的次發酵傳播),這個沒有操作過,從搜索結果看,百度知道、百度貼吧的效果不錯,建議嘗試 4、有必要考慮導入的...