ANDX V3.0 如何使用自带的采集功能实现自动更新网站数据
ANDX V3.0 自带的采集功能,可以实现24小时不间断采集与更新数据,达到无人值守的效果。
具体方法如下:
一、打开需要采集数据的栏目的配置文件,如:config/article/pick.andx
    <item>
      <key>pick</key>
      <value><![CDATA[1]]></value>
    </item>
    <item>
      <key>setup</key>
      <value><![CDATA[name1]]></value>
    </item>
    <item>
      <key>name1.url</key>
      <value><![CDATA[http://xxx.com/]]></value>
    </item>
    <item>
      <key>name1.list</key>
      <value><![CDATA[(list-3-(\d+).html)]]></value>
    </item>
    <item>
      <key>name1.detail</key>
      <value><![CDATA[(detail-(\d+).html)]]></value>
    </item>
    <item>
      <key>name1.topic</key>
      <value><![CDATA[td:class:forumTopic1]]></value>
    </item>
    <item>
      <key>name1.content</key>
      <value><![CDATA[td:class:content]]></value>
    </item>
    <item>
      <key>name1.sort</key>
      <value><![CDATA[5]]></value>
    </item>
pick:1表示启用,0表示不启用。只对该栏目有效。
setup:可以为多个站点,用半角逗号分割。后面的部分需要相应复制、粘贴,改name1为name2...以经类推。
*.url:采集的网址。
*.list:采集页面的列表页地址的正则判断格式。
*.detail:采集页面的详情页地址的正则判断格式。
*.topic:标题所在的标签:标签:标识名:标识值。
*.content:内容所在的标签:标签:标识名:标识值。
*.sort:数据在网站上使用的分类ID号。
二、运行pick.bat。
  • 真诚Empressment
  • 高效Efficiency
  • 进取Enterprise
WEIXIN
PHONE
CALL
QQ
TOP
X