From ljg-skills
Extracts actionable insights from academic papers for non-experts, generating structured Org-mode notes from arXiv links, PDFs, URLs, or analysis requests.
npx claudepluginhub lijigang/ljg-skills --plugin ljg-skillsThis skill uses the workspace's default tool permissions.
---
Deeply analyzes a specific research paper: dissects experimental setups, extracts key numbers, evaluates claims against hypotheses. For arXiv IDs and analysis requests.
Processes research paper PDFs from local paths, URLs, or arXiv; extracts metadata, content, links; generates study materials in user's language for deep analysis.
Downloads arXiv papers (PDF, TeX), generates Chinese Markdown reports with analysis, breakdowns, Mermaid diagrams for methods/workflows. For detailed interpretation, not quick summaries.
Share bugs, ideas, or general feedback.
读论文不是做学术,是猎取思想。把别人的发现拆解成自己能用的认知。
让一个不懂这个领域的聪明人读完笔记,能复述:
如果输出在任何一点上让外行卡住,就是失败。凝练只在 title 上追求;正文该展开就展开——目标不是短,是让人从不懂走到懂。
*bold*(单星号),禁止 **bold*** 开始,不跳级所有图表用纯 ASCII 字符。允许:+ - | / \ > < v ^ * = ~ . : # [ ] ( ) _ , ; ! ' " 和空格。禁止 Unicode 绘图符号。
输出结构依据 references/template.org。禁止参考 ~/Documents/notes/ 中已有论文文件的章节结构——旧文件可能使用过期模板。
date +%Y%m%dT%H%M%Sdate "+%Y-%m-%d %a %H:%M"{时间戳}--paper-{简短标题}__paper.org~/Documents/notes/#+title: {一句精练语句提炼论文核心思想或发现}
#+subtitle: {论文原始标题,通常英文}
#+date: [{YYYY-MM-DD Day HH:MM}]
#+filetags: :paper:
#+identifier: {YYYYMMDDTHHMMSS}
#+source: {URL 或来源描述}
#+authors: {作者列表}
#+venue: {发表场所/年份}
title 是这篇笔记的灵魂句——读者扫一眼就知道这篇论文带走什么。它不是文件名,不是方法名,是核心思想或发现的凝练表达。
不是"把一段话压成一句话",是"用一刀把骨头取出来"。抽出 title 贴墙上,它本身就该像一句警句、一个篇名、一句能记住的话。
写作约束(按优先级)
中文母语凝练 — 像汪曾祺、王小波、阿城、李娟的标题:短、净、有刃。
~/.claude/PAI/USER/AI_WRITING_PATTERNS.md(必扫 Layer A)。零中英混杂 — title 不出现英文术语(RL / HR / Agent / Multi-agent / token 等都不行)。术语放正文展开,title 只放思想。例外:人名、产品名(GPT、Claude)。
6-15 字 — 短到能记住,长到能承得住一个发现。超过 15 字基本就是没炼到位——回去再砍。
动词为骨,名词具体 — 形容词能砍就砍("重大的""根本的""惊人的"全删)。每个字都得干活。
自带张力,三种姿态任选其一:
不复述题目,不当方法名 —
正例对照(看转化方向)
| 论文核心思想 | ✗ 翻译腔 / 口语化 | ✓ 中文凝练 |
|---|---|---|
| 奖励信号把模型锁在已会轨迹里,擦掉题目就解锁 | 奖励信号会把模型锁死在已会的轨迹里,擦掉题目就解锁了 | 学会,反成枷锁 |
| 只用错样本做 RL,反思能力自己长出来 | 只用错样本做 RL,反思能力自己长出来 | 错处长出反省 |
| 模型在向量空间里思考比生成 token 更省更准 | 模型在向量里想,比一边想一边写更省、更准、更快 | 默想胜出口 |
| 多智能体缺的是组织协调而非个体智能 | Multi-agent 缺的不是聪明,是 HR——成功率 69 跳到 85 | 多智不如善织 |
| 老师与学生看待问题的角度不同导致教学失败 | 老师比学生高分还教不会,是因为他想问题的姿势跟学生不一样 | 高分难为师 |
| 写作时预测剩余长度让模型知道何时收尾 | 把"还要写多长"做成一个值函数,模型每写一个 token 就知道离收尾还有多远 | 知止方能落笔 |
注意正例的共性:
自检三问(写完默念)
任一答 No → 回去重写,不要凑合发布。
可识别性测试(必须过)
把 title 单独贴出来,给一个没读过这篇论文的人看,问:「这论文大概在讲什么?」——他不需要给出准确答案,但应该有方向感。
如果答得出方向 → title 通过。 如果完全猜不到(典型是高度凝练的古文式 title),必须用中文 subtitle 兜底,让它承担解释功能。英文 subtitle 只是论文原标题,不算兜底:
#+title: 字未出,止已现
#+subtitle: 把"还要写多远"做成一个 value 函数 — Length Value Model: ...
凝练和可识别性必须共存。只凝练 = 6 个月后自己也认不出是哪篇;只可识别 = 退化回 28 字啰嗦句。两个测试都过才发布。
与其他字段的关系
paper-{简短标题} 的「简短标题」是方法名 / 核心概念名(如 prerl、dsrl),用于文件检索;title 是思想骨句,用于内容入口——两者不同字段,互不替代。文件写入后报告路径。
四条核心原则,决定文章是"活人在说话"还是"机器在汇报":
讲解论文时可以拿的工具,没有哪个是必须的:
确保拿到:标题、作者、摘要、核心方法、结果。
如果论文有一张承载全文核心思路的总览图(overview / architecture diagram,通常是 Figure 1),提取并保存到 ~/Documents/notes/images/,文件名 {identifier}--paper-{简短标题}-overview.png。
判断标准:这张图让人一看就抓住论文在做什么。不是所有论文都有——没有就跳过,不要硬找。
提取方法:
arxiv.org/html/...),找到图片 URL,WebFetch 下载不是描述问题,是让读者亲历那个问题。开场给一个具象示例——一个具体场景、一段输入输出、一张失败截图、一个用户故事——让读者在这个例子上看到困境。
不是「大模型在事实回答上存在幻觉问题」,是:「你问 GPT『2023 年图灵奖得主是谁?』它一本正经回答 Yann LeCun。再问一次,它说 Hinton。第三次又变了。」
三段叙事,用同一个例子贯穿:
如果论文没有明确的前作(开创性问题、新领域),跳过第二段,直接「亲历→新口」。
三段是节奏要求,不是格式要求——不要硬加 **亲历/**旧路/**新口 子标题。问题节用一段连续叙述更有钩力,子标题会把"流"切成"段"。子标题留给翻译节用(机制要分步揭开)。
反例:「本文提出了一种新的 XXX 框架」——这是学术摘要,不是问题。
「问题」已经把困境讲透了——这一节不要再重述问题。重心是"如何做到":论文的方法、机制、关键 insight。
沿用同一个例子:继续在「问题」里那个具象示例上讲。读者刚刚在那个例子上看到旧路走不通、新口在哪里——你现在带他在同一个例子上一步步打开论文的方法。换例子 = 切语境,读者前面建的直觉就丢了。
唯一豁免:如果同一例子无法支撑机制细节(比如算法过程需要展开数据流),引入"子例子"作为延伸——但子例子必须和父例子在同一问题域里,让读者感觉是"放大镜下看局部",而不是换地图。
开头立锚点:找到一个具象的中心隐喻或画面——锚点描述的是方法在那个例子上的样子。比如「在我们刚才那个图灵奖问题上,方法像一个分诊台:先把不确定的回答拦下来再说」。锚点和「问题」例子焊在一起。
一步步揭开,让读者解锁迷雾:每段往前推一步,每段都给读者一个新视角,"啊,原来如此"的小揭秘累积成对例子的深度理解。揭秘动词:"这时候你看……""于是发生了……""那这一步怎么办呢——他们想到……"。前一段说的事打开后一段的口子。
需要覆盖(都在那个例子上):
子标题按内容需要组织,不必固定。
翻译节必有清单(防止"凝练"把肉削了):
挑出论文中最关键的 3 个概念(方法名、架构组件、数学对象、新定义……),逐个拆解。
3 个是 floor 不是 ceiling——砍到 2 个通常意味着漏掉了一个隐藏在方法里的关键设计选择(比如 LenVM 的 constant -1 reward——它不是"组件",是让整套机制 work 的设计 trick,必须单独成节讲)。如果论文真的只有 2 个独立关键概念(罕见),明确说明,不硬凑。
每个概念都在「问题」那个例子上落地——不是孤立讲一个术语,是回到那个例子,让概念在那个语境里浮出水面。读者每解锁一个概念,对那个例子的理解就深一层,迷雾就散一片。
每个概念:
选概念的标准:读者如果不懂这个,后面的洞见和审稿就跟不上。已经在「翻译」里讲透的不重复选。
整篇论文最值钱的往往就一个点——作者真正找到的那颗新结晶。
用一句话把它说出来。这句话应该让读者觉得「这个想法我可以带走」,而不是「哦,论文说了这么个事」。
检验标准:把这句话单独抽出来,脱离论文上下文,它还有没有力量?如果只是在复述论文结论,那不是洞见。洞见是你读完之后自己看到的那个东西——论文里未必直说,但逻辑指向它。
说不出来就重读第三步。如果论文确实没有思想火花,直说「这篇论文是工程改进,没有认知层面的新发现」。不要硬挤。
换身份:这个方向上带了二十年研究生的博导。学生拿着论文来找你,你判断这东西值不值得认真对待。
用白话说,像在办公室跟学生聊:
好的说好,差的说差在哪儿。
落点在"能用",不在"能想"。给出"这意味着你可以___",而非"这让我们重新思考___"。
用三个视角试探连接,命中展开,没命中跳过,全没命中说「没有」:
逐条扫红线。额外检查:
列修改清单确认后生成文件。
按 Denote 规范获取时间戳,读 references/template.org,写入 ~/Documents/notes/。