Sora2会推动科研论文写作方式从文字向视频转变吗?
原问题
文字写作论文是受限于视频形式在过去传播和存储的困难,论文本身是为了说明解释科研结论的得出过程和方法,用视频来展示将会更加直观和便于理解。
我的看法
有可能。并且从实践与数据上看,图像/视频形式能显著提升理解效率与传播效果。
就Transformer这个结构,这是文字表述,非常精炼且浓缩,但你就看吧,你看看你得多久才能真正理解。我见过太多人因为至今没理解这个公式而放弃学Deep Learning的。

文字版:Transformer 的核心公式与细节,理解门槛较高。

图解版:结构关系更直观,降低理解难度。
这是图片形式,是不是一下子就一目了然了?就是几个格子(矩阵)的基础运算。

过渡示意:从公式到图解,信息层级逐步清晰。
然后最终版来了,视频版本,是不是更加直观且好懂了?

动图版:过程化呈现让理解更顺畅,降低学习负担。
人是视觉动物,不然为什么几亿人刷抖音,而看书需要坚持。 最近几年在论文投稿的时候开始要求新增“Graphic Abstract”这种东西,在以前并不流行。 效果类似于这样,就是在文字版的Abstract前后加一个图片的Abstract,现在很流行你可能看起来觉得没什么。

示例:图形摘要(Graphical Abstract)用一张图传达核心信息。
传统的结构是专业的,几个大字号的标题,然后是200-300字的Abstract,紧接着就是大篇幅的文字正文。

传统结构:标题 + Abstract + 正文的静态呈现方式。
很明显,前面一个不管是可读性还是美观度,明显好于第二个。
特别是可读性,Graphic Abstract要求你用一张图片来让读者迅速的理解你的核心内容。
我们就用 Elsevier 的政策来解释一下:
A graphical abstract should allow readers to quickly gain an understanding of the take-home message of the paper and is intended to encourage browsing, promote interdisciplinary scholarship, and help readers identify more quickly which papers are most relevant to their research interests.
参考链接:Elsevier Graphical Abstract 政策

对比:图形摘要在可读性与美观度上的优势一目了然。
翻译过来就是:应使读者能快速理解论文的核心信息,旨在鼓励浏览、促进跨学科研究,并帮助读者更快地识别与其研究兴趣最相关的论文。
并且这玩意是有数据支持的,带有Graphic Abstract的文字不管在曝光度还是引用量几乎是翻倍的效果。

数据支撑:图形摘要显著提升曝光与被引概率。
我从读者角度来看也是很享受的。

读者体验:更快抓住核心与流程,减少无效阅读。
要知道,要想用文字描述清楚某种方法论或者流程是很难的,文字适合去解释那些细节内容,而general的流程以及pipeline,最适合的就是图片。
说白了,文字是“无奈的最优解”,不是终极形式
学术论文的文字形式,本质上是历史条件下的产物。
在纸质时代,文本 + 图表是最具存储效率、最易复制、最可审阅的形式。
即使到了数字时代,PDF依然延续了这种逻辑:它保证结构化引用(页码、公式编号、图表标注)和可归档性。
但它同时也压抑了另一种更高维度的表达方式:动态、过程化、感知性理解。
比如:
- 神经网络的学习过程;
- 物理场景中复杂的流体动力学;
- 建筑或生物结构的演化;
这些都难以在静态文字中完整传达。
因此,可以说:
“论文的文字形式是对传播媒介的妥协,而不是知识表达的终点。”
原文指路:知乎回答