网址

方法论

部署服务器是要钱的,打钱就是最大的支持

前言

具体这个数据都是怎么来的在网站页面上都有讲,我也不可能教你怎么用电脑,如果你连浏览网站都有困难的话你先打给我 200 欧我再教你。

正文

总的来说这个 Open Scholar Ranking 这个项目就是我用一些有趣的数据做一些有趣的分析这样,目前这个产出就是分析各国籍的人去哪些国家哪些城市哪些机构好留。

以下说明来自 GPT-5.5,我是懒得手打了:

Arrival 是什么
Arrival 就是“到达过这个目的地的人/权重”。

这里的目的地可以是国家、城市、机构三层。严格说它不是裸人数,而是按 ORCID 记录可信度加权后的 arrival mass;发帖时可以先说“近似理解为到达人数”。

例子:

  • 一个人原点是中国,后来去了日本东京大学。
  • 那么日本获得 1 个 arrival,东京获得 1 个 arrival,东京大学获得 1 个 arrival。
  • 如果记录置信度是 0.8,那就是 0.8 个加权 arrival。

Stay 是什么
Stay 衡量的是:到达这个目的地之后,这个人后来有没有再换国家。

注意,Stay 判断的是“国家是否继续移动”,不是“是否一直待在同一个学校”。

例子 1:

  • A:CN 本科 -> JP 硕士 -> JP 博士 -> JP 工作
  • 对 JP、日本城市、日本机构来说,只要 A 到达后后面没有再离开日本,这就是 stay 成功。
  • 如果 100 个有后续记录的人里 80 个后来没离开该国,stay = 80%。

例子 2:

  • B:CN 本科 -> JP 硕士 -> US 博士
  • B 到达日本后后来换到了美国。
  • 所以日本、他在日本的城市、他在日本的机构,stay 都失败。

No return 是什么
No return 衡量的是:到达这个目的地之后,这个人后来有没有回到母国。

例子 1:

  • C:CN -> JP -> US
  • C 没有回中国。
  • 对日本来说,no return 成功;对美国也成功。

例子 2:

  • D:CN -> JP 硕士 -> CN 博士 -> US 工作
  • D 后来回过中国。
  • 所以日本这个经历的 no return 失败。
  • 哪怕 D 后来又去了美国,也不改变“日本这段经历没有让他避免回国”这个判断。

这点很适合解释给留学生看:
Stay 看“有没有留在当地国家”;No return 看“有没有避免回到母国”。

最后一个节点为什么不算 stay / no return
如果一个人的最后记录是:

  • CN -> JP

然后没有任何后续记录,我们不知道他是真的留在日本,还是只是数据没继续记录。

所以这个 JP 会算 arrival,但不会拿来判断 stay 或 no return。
这叫右删失,简单说就是“没后续证据,不硬猜”。

国家、城市、机构是怎么一起算的
例子:

  • E:CN -> JP 京都大学 -> JP 东京大学 -> US MIT

这个人先进入日本,然后在日本内部从京都移动到东京。
算法会认为:

  • 日本:有一个 arrival
  • 京都:有一个 arrival
  • 京都大学:有一个 arrival
  • 东京:也有一个 arrival
  • 东京大学:也有一个 arrival

后来 E 去了美国,所以这些日本相关节点 stay 失败。
但如果 E 没有回中国,那么这些日本相关节点 no return 成功。

Tier 是怎么算的
Institution 表里的 Tier 不是原来的 global ranking,而是 mobility 自己的 tier。

先给每个机构一个 mobility 分数:

mobility score = (stay + no return) / 2

例子:

  • 机构 A:stay = 90%,no return = 80%,score = 85%
  • 机构 B:stay = 60%,no return = 90%,score = 75%
  • 机构 C:stay = 40%,no return = 50%,score = 45%

然后按这个 score 从高到低排,再用递归三分位分成 R1、R2、R3、R4。
大概可以理解为:

  • R1:最强 mobility 留存/不回流机构
  • R2:强
  • R3:中等
  • R4:弱

一句话版本
Arrival 看“多少人到过这里”;Stay 看“到这里之后有没有继续留在这个国家”;No return 看“到这里之后有没有回母国”;Tier 则把机构的 Stay 和 No return 合起来,分成 R1 到 R4。

计划

机构排名

我最近在研究给机构的学术威望排名,或者准确来说其实已经搓出来了,在 osr.clarelab.moe/ranking 可以看到,而且说实话效果很好,这个排名基本上就是学术圈用脚投票出来的,是学术圈的润的选择,而且比我以前那个基于 SpringRank 的排名(见此贴)效果要好。不过目前这个是总榜,对于特定领域参考价值有限,所以我是打算等到憋出来能细分领域或者学科了再公布的,而且本质来说这个是科研人员最终去哪的排名,对于一般人来说意义没那么大,所以我也在考虑科研出所谓 “进路榜” 去衡量 placement,诸如此类,到时候还会水贴。

Venues 排名

另一方面最近在跑另一个数据集,用同一套模型尝试给 Venues,也就是期刊会议之类的排名,毕竟现在学术圈唯一衡量 Venues 价值的基本就是 IF,然后 IF 本身是一坨屎,学界很搞笑的解决的方案就是根据学科和领域无限细分再分区。问题是,就算我们有温州大学 > MIT 的 US News,也有马来亚王朝的 QS,但是其实大家或多或少都懂点大学,前二三百都有数,但是期刊会议这些相对来说不透明度更强一些,所以出一个 Venues 的排名可能意料之外的会很有效果,之后看情况公开。

流动排名(也就是本贴图中那些)

之后的话至少会有一些小更新:

  • 优化小屏体验,毕竟现在只有大屏能看,小屏一坨
  • 好像是可以做一些更高级的分析的,但是我暂时有点大脑短路
  • 想做那种,比如你输入背景,能根据数据匹配出一些高润学成功率的路径方案的,全自动了属于是

以上。


Suitable-Virus1519 · 2026-06-07 12:08:14 UTC · +5 · oq95icf ·

优质科研还带方法论解释,致敬

jemy-228 · 2026-06-07 12:40:52 UTC · +2 · oq9ak18 ·

最权威的网站,respect!

Baselineaccount · 2026-06-07 14:01:04 UTC · +2 · oq9otfy ·

厉害的

ericcitaro · 2026-06-07 14:20:52 UTC · +1 · oq9sp0u ·

Nb

MissionRunNow · 2026-06-07 14:26:03 UTC · +3 · oq9tqlc ·

我感觉这个思路如果用来评价润的能力可能有一点问题,不知道是不是我想错了。

1.如果A的记录显示CN本->JP硕->JP博,实际上A可能还在攻读学位,这个记录会被计算为stay吗?

2.如果A毕业工作后没有学术产出,stay和no return的结果是否难以评估?

No-Lab4175 · 2026-06-07 17:17:26 UTC · +2 · oqatjkb · OP · :JP: 日本 ·

是的,口径实际上可以收得更严格,不过这里没有算到强制就业

RipLoud3334 · 2026-06-07 15:43:36 UTC · +2 · oqa9unw ·

不赖啊,标记一下

GarbageVandalism · 2026-06-07 16:49:38 UTC · +1 · oqanmlo ·

连我村Gatersleben这鸟不拉屎的地都能上榜,吓死我了

Prestigious-Frame442 · 2026-06-07 17:43:36 UTC · +1 · oqaz2mh ·

这个有意思