国产玉足榨精视频在线_亚洲日韩国产第一区_男人都懂的网站在线观看免费_久久91亞洲精品中文字幕奶水_按摩房技师激情国产精品_无人在线观看视频在线观看_年轻女教师2免费播放_欧洲熟妇色xxⅩx欧美老妇多毛_91爱视频成人在线第一页_欧美日韩中文字幕成人网

日志樣式

葫蘆島網(wǎng)站建設(shè)500元(帝國cms付費(fèi)可見插件)帝國cms模板教程,

原標(biāo)題:讓你的帝國CMS采集更精準(zhǔn):如何設(shè)置規(guī)則過濾?如果你使用過帝國CMS,你一定知道它自帶了一個采集功能但是在采集的時(shí)候,我們經(jīng)常會遇到一些垃圾信息,如何過濾這些信息呢?今天就來和大家分享一下一、采集規(guī)則設(shè)置

在進(jìn)行采集之前,我們需要先設(shè)置好采集規(guī)則在帝國CMS中,我們可以通過設(shè)置規(guī)則來過濾掉那些不需要的信息具體操作如下:1.進(jìn)入“采集管理”頁面,點(diǎn)擊“新建任務(wù)”按鈕;2.在任務(wù)設(shè)置頁面中,選擇“采集規(guī)則”選項(xiàng)卡;。

3.在“列表區(qū)塊”中設(shè)置需要采集的內(nèi)容;4.在“正文區(qū)塊”中設(shè)置需要提取的正文內(nèi)容;5.在“附加區(qū)塊”中設(shè)置需要提取的附加信息通過以上步驟,我們就可以設(shè)置好基本的采集規(guī)則了二、正則表達(dá)式過濾除了基本的規(guī)則設(shè)置外,我們還可以使用正則表達(dá)式來進(jìn)行過濾。

在帝國CMS中,我們可以在“列表區(qū)塊”、“正文區(qū)塊”、“附加區(qū)塊”的“屬性值”或“匹配模式”中使用正則表達(dá)式來過濾信息例如,在“列表區(qū)塊”的“屬性值”中,我們可以使用以下正則表達(dá)式過濾掉一些不需要的信息:

這個正則表達(dá)式可以匹配到所有的圖片地址,我們可以將其替換成空字符串,這樣就可以過濾掉所有的圖片了。三、關(guān)鍵詞過濾

除了使用正則表達(dá)式外,我們還可以通過設(shè)置關(guān)鍵詞來進(jìn)行過濾在帝國CMS中,我們可以在“采集規(guī)則”選項(xiàng)卡中的“過濾設(shè)置”中設(shè)置關(guān)鍵詞例如,在“標(biāo)題”和“正文內(nèi)容”中,我們可以設(shè)置一些關(guān)鍵詞,如果采集到的信息中包含這些關(guān)鍵詞,就會被自動過濾掉。

四、手動審核除了以上方法外,我們還可以通過手動審核來過濾信息在帝國CMS中,我們可以在采集完成后進(jìn)入“采集管理”頁面進(jìn)行手動審核如果發(fā)現(xiàn)有一些不需要的信息,我們就可以直接刪除或修改五、使用插件除了以上方法外,我們還可以使用一些插件來進(jìn)行信息過濾。

例如,在帝國CMS中有一個名為“采集助手”的插件,它可以幫助我們自動過濾掉一些不需要的信息六、定期清理數(shù)據(jù)庫最后,在進(jìn)行采集的時(shí)候,我們還需要定期清理數(shù)據(jù)庫在帝國CMS中,我們可以通過進(jìn)入“系統(tǒng)管理”->“數(shù)據(jù)維護(hù)”->“清理數(shù)據(jù)庫”來進(jìn)行清理。

這樣可以有效地減少數(shù)據(jù)庫的負(fù)擔(dān),提高網(wǎng)站的運(yùn)行速度七、總結(jié)通過以上方法,我們可以有效地過濾掉不需要的信息,使采集到的內(nèi)容更加精準(zhǔn)、優(yōu)質(zhì)但是,我們在使用這些方法的時(shí)候,也需要注意不要過度過濾,否則會影響到采集效率。

八、案例分析最后,我們來看一個案例假設(shè)我們要采集一些科技新聞,并且需要過濾掉那些與科技無關(guān)的信息我們可以通過設(shè)置關(guān)鍵詞、正則表達(dá)式等方法來進(jìn)行信息過濾例如,在“標(biāo)題”和“正文內(nèi)容”中,我們可以設(shè)置一些關(guān)鍵詞,如“體育”、“娛樂”等,如果采集到的信息中包含這些關(guān)鍵詞,就會被自動過濾掉。

同時(shí),我們還可以使用正則表達(dá)式來過濾一些不需要的信息,如圖片地址、廣告等通過以上方法,我們可以快速地采集到與科技相關(guān)的優(yōu)質(zhì)內(nèi)容,并且避免了垃圾信息對網(wǎng)站造成的負(fù)面影響。返回搜狐,查看更多責(zé)任編輯: