Tags:
瑜伽学习软件大全
旅游app软件
赛车游戏大全
好玩的手游排行
水淼软件出品的批量筛选网页有效性的工具。
可筛选出失效网页、被搜索引擎限制的关键词、未收录网址。
判断网址有效的条件设置:
按网页状态
根据目标网页返回的状态码来判断。可以输入状态码,如200、301等,多个状态码使用“|”隔开,如“200|301”。取反就是将真变为假,假变为真。
按网页内容
根据目标网页返回的源代码来判断。可以输入关键字,多个关键字使用“|”隔开,如百度的限制搜索提示“根据相关法律法规和政策,部分搜索结果未予显示”。取反就是将真变为假,假变为真。
当所有条件为真时,软件就会标注为有效的(√),否则就是无效的(×)。
其他设置:
API访问
如果遇到个别https网页筛选失败的,可以启用API选项。如果同时启用了浏览器渲染选项,则判断网页内容时用浏览器,判断网页状态时用API。
浏览器渲染
默认只是读取静态代码,但是有的网页是JS动态加载的代码,需要浏览器环境来渲染执行才能得到真实代码。启用该功能将无法使用多线程,并且速度会相对慢些。
线程数
如果筛选不同网址,可以设置多个线程,如10个或更多。如果是筛选百度等搜索引擎对某些关键词的限制情况,则必须将线程数设置为1,且设置间隔秒3秒以上,因为搜索引擎存在过快访问的自动屏蔽。可以使用网址生成器来生成一组关键词的百度搜索链。
间隔秒
每筛选一个网址后停留的秒时间。
超时秒
请求网页最多等待时间,如果超出这个时间目标网页还没响应就会停止继续请求。
保存按钮
左击保存有效的(√),右击保存无效的(×),下方的“关键词”复选框,用于指定保存网址中的关键词参数
升级记录(2019年11月26日):
1.0.0.0:首个版本发布于2014年10月6日深夜12点半
1.0.0.1:修复xp下无法显示列表框图标的问题。
1.0.0.2:修复间隔秒单位错误问题
1.0.0.3:更新一些提示问题和界面问题。
1.0.1.1:尝试修复部分电脑取硬盘码失败的问题。
1.0.2.0:修复保存关键词时部分情况遇到保存错误的问题。
1.1.0.0:增加输入网址列表按钮(之前只能从别处复制网址列表再直接筛选)等界面调整;自动删除网址中的空格避免有空格的域名筛选失败;修复状态码为0时错误提示为100;调整软件设置的默认值;其他更新
1.1.2.0:网页内容判断新增忽略大小写和正则匹配选项。
1.1.3.0:恢复网址合成功能并有所改进。
1.2.0.0:增加浏览器渲染选项;界面调整。
1.2.0.1:微调浏览器渲染读取源码。
1.2.5.0:更换浏览器渲染引擎为谷歌内核,现在可以用浏览器渲染选项获取到更多网页的内容进行检测了。
1.2.6.0:新增筛选时Cookies设置。
1.2.8.0:新增代理IP设置,新增API访问选项。
1.2.9.1:9.0遗忘,从8.0基础增加避免线程崩溃。
1.2.10.0:浏览器渲染模式禁止信息框弹出;浏览器渲染增加时间等待以获取到真实执行代码。
1.3.0.0:升级谷歌内核。
1.3.1.0:解决浏览器渲染选项个别网站卡住的问题。