批量保留网页消息 (批量保留网页内容)

壮壮在一家医药批发单位上班,须要经常和本省的一些制药企业咨询,但记载网页中泛滥咨询地址的上班量是十分大的。以登录中国医药网(为例,在“搜查企业”处输入“四川”,一共可以取得159家企业之多。

如今咱们应用网络数据库探求者来批量保留这些咨询地址,就能大大缩小重复休息的上班量。

一、查找页面法令

在经常使用网络数据库探求者前咱们要摸清页面的法令,普通可以从两、三个所需页面的链接地址对比中找到法令。在“四川”的企业列表中进入第二、第三页,发现它们的地址区分为:四川&c=和四川&c=,可见解址变动的就是p的值,依此类推就可以得出p=4是第四页、p=5就是第五页……这里的p就是数据页的url主要字,其前面的地址局部是url1,前面的&t=company&terms=四川&c=则是url2了。www.ITComputEr.cOM.CN

二、设置规定

分明页面法令后还须要为要保留的网页消息建设一个规定。开启网络数据库探求者,在“文件”下点击“新建规定文件”关上“设置规定”窗口(图1)。首先设置“一级规定”,一级规定的内容就是相似制药企业列表这样的一级数据了。在“规定用途”方面是依据所要保留的页面数据大小来定,这里的各企业咨询方法数据较小就勾选“提取普通数据”,接上去给规定输入一个称号并输入数据页的url1、url2和主要字。

揭示:假设没有url2就以空格替代;填写url主要字的时刻要留意其大小写要和实践地址中的分歧。

由于在页面中咱们只有要其中的列表局部,这里要设置一下列表局部的“起始主要字”,普通可以取列表上一行的固定文字,这里取用“共有159家企业”;“每页行数”则是从主要字开局不时到列表完结的行数,包含空格;“提取页数”就是列表的页数了,这里共有11页,就设置为“1到11”,“递增值”普通设置为1。

咱们真正所需的企业咨询消息是列表中的各个企业的链接页面值,即二级数据,因此在设置完“一级规定”后勾选“二级规定”,进入“二级设置”选项卡,勾选“经常使用提取行数”,“二级链接的url范畴”的选用可先在软件自带的阅读器中关上一个一级数据网页如?p=2&t=company&terms=四川&c=,而后按下“二级链接的url范畴”后的小按钮,在弹出的窗口中定位好所需网页资料的序号(图2),若须要28~42之间的二级数据,则“二级链接的url范畴”就是“28到42”;而后像设置“一级规定”一样设置好“二级数据页的起始主要字”和“提取行数”就可以“确定”保留规定了。

揭示:在选用“经常使用提取行数”和“经常使用完结主要字”时要留意,假设二级数据的行数固定就选“经常使用提取行数”选项,否则选“经常使用完结主要字”。

三、批量提取数据

规定设置终了前往软件主界面就可以提取所须要的网页消息了。在“规定”下选用刚才建设的规定文件“四川制药企业”,单击“提取”按钮就可以口头数据库的消息提取了。提取终了,在“数据阅读”中可以检查到与一级数据相对应的二级数据即各制药企业的详细咨询方法了。运转“文件→提取的数据另存为文本”就能保留所须要的网页消息了。

编后:某些网站提供的网页消息是以分页方式颁布进去的,这样的网页具备必定的法令性且数据量大,要想保留这样的网页若依托手工逐个操作,上班量太大。经常使用网络数据库探求者可以间接读取网站数据库来保留网页消息,能够有效缩小重复休息,减轻上班量。

批量转换中文文件名为拼音 在Windows 98的MS-DOS环境下,一切中文文件名的文件都不可反常识别。此时就有必要将这些文件的文件名转换为英文或是对应的汉语拼音。上方笔者就教大家一招如何在瞬间将多个中文文件名更改为其对应汉语拼音的方法。

第一步:下载一款名叫《拖把更名器》的软件,装置到系统中后,选用“裁减更名”选项卡,将“预设打算”设置为“汉字转换为拼音”选项。

第二步:单击菜单“文件→增加文件”并在关上的窗口当选用待转换文件名的文件。(可以一次性选用多个文件)。

第三步:单击菜单“更名→运行”即可将一切增加出去的中文文件名转换成相对应的汉语拼音文件名了。

留意:假设在更名后还想再撤销,那你就得事前保留以后的操作记载,在须要撤销时,再导入操作记载并单击“撤销”按钮即可。保留操作记载的方法:单击“文件→导出以后文件列表”即可。

© 版权声明
评论 抢沙发
加载中~
每日一言
不怕万人阻挡,只怕自己投降
Not afraid of people blocking, I'm afraid their surrender