找回密码
 立即注册
搜索
热搜: 活动 交友 discuz
查看: 3392|回复: 0

轻松提取百度文库及豆丁网的文档文字内容

[复制链接]
发表于 2011-8-22 23:46:36 | 显示全部楼层 |阅读模式
百度文库和豆丁网都有大量的文档资源,但其中的大多数文档都要注册并且要相应的财富或金币才能下载,以下方法能在不下载的情况下提取里面的文档内容。

首先,找到自己要的文档,把文档标题复制下。 在搜索引擎框里输入后按回车:site:wenku.baidu.com 标题 (标题前有个空格),如搜索 关于生命的名言,输入:site:wenku.baidu.com 关于生命的名言
搜索引擎每条搜索结果后都有网页快照,如百度有百度快照,谷歌有网页快照,此时点击快照进入另一页面.
打开快照之后,我们就可以看到以普通页面的形式显示百度文库正文内容了。最后,我们就可以通过复制来实现文档内容的提取了。
另外提取豆丁网的文档内容的方法是一样的,只要在搜索时把那wenku.baidu.com替换为docin.com即可。如:site:docin.com GCT英语复习-72关键句

回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

QQ|Archiver|手机版|小黑屋|腾飞在线 ( 冀ICP备05002530号 )

GMT+8, 2026-2-13 16:43 , Processed in 0.053784 second(s), 16 queries .

Powered by Discuz! X3.5

© 2001-2026 Discuz! Team.

快速回复 返回顶部 返回列表