从网页上直接扒取latex格式的公式

38,290次阅读
没有评论

共计 645 个字符,预计需要花费 2 分钟才能阅读完成。

latex 是写公式非常方便的格式,很多具有专业性质的网站,发布者在发布公式内容时都采用的 latex 的形式。但是我们读者看的时候这些公式是图片的形式,不方便扒取下来进行编辑。最近写作业的时候遇到这个问题,联想到了 HTML,稍微研究了一下网页,找到了这个偷懒的方法。
这里以知乎为例。
从网页上直接扒取 latex 格式的公式

这是知乎的一篇关于高斯核函数可改写成内积形式的推导,推导部分自己重新推一遍问题不大,但是里面有个多项式展开的公式形式很复杂,属实不想再在 latex 里面敲一遍:
从网页上直接扒取 latex 格式的公式

这个时候我们就需要用到 HTML。首先按 f12 打开网页查看器,我用的是火狐浏览器,不同浏览器操作上可能有细微的差别,大家自己摸索一下就行。初始的界面是很简洁的,如下图所示。
从网页上直接扒取 latex 格式的公式

接下来我们打开网页的 body,发现变得很复杂。但是看一下就会发现下面都是些 js 的,我们要的内容没关系,就在这些 js 上面的 root 标签里面:
从网页上直接扒取 latex 格式的公式

依次点开 root→App→App-main 的标签,可以发现基本上没找错。同时可以借助浏览器的指示器确认一下,是网页的主体部分。
从网页上直接扒取 latex 格式的公式从网页上直接扒取 latex 格式的公式

接下来就是一样的过程,同样借助浏览器的指示,找到网页具体内容的 css 格式部分。每一次的展开我就不具体展示了,直接看到展开的我们需要的内容:
从网页上直接扒取 latex 格式的公式

可以看到,每一行的 data-pid 就对应了网页的一行。借助指示器找到我们要的那一行公式,展开:
从网页上直接扒取 latex 格式的公式 我们需要的公式就在里面了:
从网页上直接扒取 latex 格式的公式

双击公式的地方,可以进入编辑状态,直接复制 latex 代码。
从网页上直接扒取 latex 格式的公式

复制到 latex 编辑器里看一下效果:
从网页上直接扒取 latex 格式的公式从网页上直接扒取 latex 格式的公式

之后就可以随意编辑了。

原文地址: 从网页上直接扒取 latex 格式的公式

    正文完
     0
    Yojack
    版权声明:本篇文章由 Yojack 于2024-10-06发表,共计645字。
    转载说明:
    1 本网站名称:优杰开发笔记
    2 本站永久网址:https://yojack.cn
    3 本网站的文章部分内容可能来源于网络,仅供大家学习与参考,如有侵权,请联系站长进行删除处理。
    4 本站一切资源不代表本站立场,并不代表本站赞同其观点和对其真实性负责。
    5 本站所有内容均可转载及分享, 但请注明出处
    6 我们始终尊重原创作者的版权,所有文章在发布时,均尽可能注明出处与作者。
    7 站长邮箱:laylwenl@gmail.com
    评论(没有评论)