请选择 进入手机版 | 继续访问电脑版

蓝天采集社区

 找回密码
 立即注册
搜索
热搜: 采集 cms
查看: 159|回复: 0

有没有可能增加这么一个“采集筛选”的功能?

[复制链接]

26

主题

46

帖子

244

积分

中级会员

Rank: 3Rank: 3

积分
244
发表于 2019-4-12 14:09:20 | 显示全部楼层 |阅读模式
本帖最后由 zx5629821 于 2019-4-12 14:11 编辑

1:首先要有这么一个关键词库,关键词库可以理解为就是白名单,采集某个站点的某篇新闻,比对库中后,该文章标题,或者内容有出现白名单中的词组才允许被采集。

比如词库为AA、BB,
可选择仅比对标题或详情,或者一起比对,

此时采集新浪的某个列表,系统会先采集他们的标题及内容,然后与词库对比,在该篇文章有出现AA或BB才允许被入库,否则放弃。

2:匹配模式:可允许只要出现词库中的词语就允许入库,也可以设置为必须包含某个或多个词语才允许入库。

今天突然想到的,我觉得这项功能,可以作为蓝天未来,丰富产品或者增值的一项功能。




回复

使用道具 举报

*滑块验证:
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

Archiver|手机版|蓝天采集社区

GMT+8, 2019-6-24 23:31 , Processed in 0.019331 second(s), 20 queries .

Powered by Discuz! X3.4

© 2001-2017 Comsenz Inc.

快速回复 返回顶部 返回列表