原问题

文字写作论文是受限于视频形式在过去传播和存储的困难,论文本身是为了说明解释科研结论的得出过程和方法,用视频来展示将会更加直观和便于理解。

我的看法

有可能。并且从实践与数据上看,图像/视频形式能显著提升理解效率与传播效果。

就Transformer这个结构,这是文字表述,非常精炼且浓缩,但你就看吧,你看看你得多久才能真正理解。我见过太多人因为至今没理解这个公式而放弃学Deep Learning的。

Transformer 公式

文字版:Transformer 的核心公式与细节,理解门槛较高。

Transformer 图解

图解版:结构关系更直观,降低理解难度。

这是图片形式,是不是一下子就一目了然了?就是几个格子(矩阵)的基础运算。

过渡示意

过渡示意:从公式到图解,信息层级逐步清晰。

然后最终版来了,视频版本,是不是更加直观且好懂了?

Transformer 动图演示

动图版:过程化呈现让理解更顺畅,降低学习负担。

人是视觉动物,不然为什么几亿人刷抖音,而看书需要坚持。 最近几年在论文投稿的时候开始要求新增“Graphic Abstract”这种东西,在以前并不流行。 效果类似于这样,就是在文字版的Abstract前后加一个图片的Abstract,现在很流行你可能看起来觉得没什么。

图形摘要示例

示例:图形摘要(Graphical Abstract)用一张图传达核心信息。

传统的结构是专业的,几个大字号的标题,然后是200-300字的Abstract,紧接着就是大篇幅的文字正文。

传统论文结构示例

传统结构:标题 + Abstract + 正文的静态呈现方式。

很明显,前面一个不管是可读性还是美观度,明显好于第二个。

特别是可读性,Graphic Abstract要求你用一张图片来让读者迅速的理解你的核心内容。

我们就用 Elsevier 的政策来解释一下:

A graphical abstract should allow readers to quickly gain an understanding of the take-home message of the paper and is intended to encourage browsing, promote interdisciplinary scholarship, and help readers identify more quickly which papers are most relevant to their research interests.

参考链接:Elsevier Graphical Abstract 政策

图形摘要对比

对比:图形摘要在可读性与美观度上的优势一目了然。

翻译过来就是:应使读者能快速理解论文的核心信息,旨在鼓励浏览、促进跨学科研究,并帮助读者更快地识别与其研究兴趣最相关的论文。

并且这玩意是有数据支持的,带有Graphic Abstract的文字不管在曝光度还是引用量几乎是翻倍的效果。

图形摘要数据支撑

数据支撑:图形摘要显著提升曝光与被引概率。

我从读者角度来看也是很享受的。

读者体验示例

读者体验:更快抓住核心与流程,减少无效阅读。

要知道,要想用文字描述清楚某种方法论或者流程是很难的,文字适合去解释那些细节内容,而general的流程以及pipeline,最适合的就是图片。

说白了,文字是“无奈的最优解”,不是终极形式

学术论文的文字形式,本质上是历史条件下的产物。

在纸质时代,文本 + 图表是最具存储效率、最易复制、最可审阅的形式。

即使到了数字时代,PDF依然延续了这种逻辑:它保证结构化引用(页码、公式编号、图表标注)和可归档性。

但它同时也压抑了另一种更高维度的表达方式:动态、过程化、感知性理解。

比如:

  • 神经网络的学习过程;
  • 物理场景中复杂的流体动力学;
  • 建筑或生物结构的演化;

这些都难以在静态文字中完整传达。

因此,可以说:

“论文的文字形式是对传播媒介的妥协,而不是知识表达的终点。”

原文指路:知乎回答