论坛风格切换切换到宽版
  • 3141阅读
  • 0回复

轻松提取百度文库及豆丁网的文档文字内容 [复制链接]

上一主题 下一主题
离线海豚
 

发帖
15420
金钱
464413
威望
0
贡献值
1
只看楼主 倒序阅读 使用道具 0 发表于: 2011-08-22


百度文库和豆丁网都有大量的文档资源,但其中的大多数文档都要注册并且要相应的财富或金币才能下载,以下方法能在不下载的情况下提取里面的文档内容。

首先,找到自己要的文档,把文档标题复制下。 在搜索引擎框里输入后按回车:site:wenku.baidu.com 标题 (标题前有个空格),如搜索 关于生命的名言,输入:site:wenku.baidu.com 关于生命的名言
搜索引擎每条搜索结果后都有网页快照,如百度有百度快照,谷歌有网页快照,此时点击快照进入另一页面.
打开快照之后,我们就可以看到以普通页面的形式显示百度文库正文内容了。最后,我们就可以通过复制来实现文档内容的提取了。
另外提取豆丁网的文档内容的方法是一样的,只要在搜索时把那wenku.baidu.com替换为docin.com即可。如:site:docin.com GCT英语复习-72关键句

评价一下你浏览此帖子的感受

精彩

感动

搞笑

开心

愤怒

无聊

灌水
我爱潜水!
快速回复
限100 字节
 
上一个 下一个