我开发了一个新的文献阅读工具

很早之前我听我朋友说了一个科研体系,叫做“科研论”《钟澄》。它里面提到一个非常重要的事情,就是将文献图片全都打包入库。这样在后续做科研的时候,你可以非常快速地筛选出跟你相关领域的 Fig 1、Fig 2、Fig 3、Fig 4 怎么做。这样的话,你去做科研的时候就不会一头雾水,像个无头苍蝇一样。

这个系统的核心是截图,一开始想的是用 AI 自动进行图片的截取,但是发现 AI 截的图总是有问题。所以我索性算了吧,还是自己截图。一天看一篇文献,你就截一篇文献图,又不会死。毕竟跟领域相关的也没有那么多文章,无非就是截十张图而已,也无所谓的,压力也不大。主要是管理上确实有问题。钟澄老师是用一个Word文档管理的,虽然简陋但是有效。我想这个东西能不能给它体系化?所以之前一直在想这方面工具的开发。

所以说,我重新开发了这套阅读工具。citebox

它的核心是这样子:你登录之后呢,就可以上传文献。

image

上传完之后,我们可以手动对PDF进行截图(基于pdf.js)你拆完之后,文章里的所有图片你就会入库了。

image-1773808375695

当然,我可以自己搞了一个自动截图算法,在配置里面配置下就行,因为服务器比较弱,模型也不是特别好,很多时候不如直接手工方便。

image-1774336719519

入库完之后有什么用呢?我们提供两套思路:

  1. 对文章本身进行标签和分组。文章本身是可以标签和分组的。
  2. 对图片进行标签化。我们觉得文章里面最重要的就是图片,因为很多时候文章作者是按照图片去讲他的一个故事的。所以说我们给图片设计了专门的一套标签系统。

同时呢,我们也设计了两套笔记系统:

  1. 文献本身的笔记
  2. 图片本身的笔记

这两个笔记都单独作为体系的。

然后有个关键是我们做了一套 AI 的解读系统,因为现在大模型越来越强嘛,一个工具没有 AI 肯定是不行的。所以想着,那怎么加 AI 工具呢?我们加两套:

  1. 给图片本身的解读。一个图片你看不懂,AI 应该帮你解读一下。
  2. Tag 建议。你这个图片不知道打什么 Tag,打 Tag 就很难了。那么你可以让 AI 给你做个建议,这也没问题。

image-1774337080975

同时我们还提供了文献图文交互式的一个解读。因为我们把文献里面的所有图片都给它拆分出来。这样拆分出来之后,我们就把图片作为一个上传内容传入给 AI。然后 AI 在回答的时候把图片也输出来。这样的话,我们可以生成一个图文并茂式的文献。

因为我用的是wolai,所以我还加了一个保存到wolai的功能,只不过有一个问题就是wolai的图片上传的API不知道怎么配置,所以效果不是特别的好。

image-1774337105902
image-1774337141913

此外,最近我还加入了一个小功能,配色库,也就是支持对大图里面进行小图截图,截图完之后,就会给整理出6个配色,保存。

image-1774336896925

同时,因为最近微信开放了 Claude Bot 这个接口,允许个人用户接入。我也给自己的客户端搞了这样一个接入,使用也非常简单:

image-1774337368858

只需要打开你的微信进行扫码绑定即可。如果你无法绑定,说明你的版本比较低,建议升级你的微信到最新版本。

b792d08fb058b900eda29598198e8019

这工具很简单,我是用 Go 来做的一个后端开发,前端是无框架的原生html/js/css。编译之后,不到 7MB 的样子。

image-1774337210456

它前端用但是 WebView。WebView 是目前 Windows 10、Windows 11 以上它自带的一个功能。同时还支持MacOS,因为我交了苹果的开发税,所以我有苹果的认证。因此安装的时候相对来说比较简单,不会因为由于来自于“不明开发者”而被拦截。

评论

Your browser is out-of-date!

Update your browser to view this website correctly. Update my browser now

×