Verified Commit f72fcc19 authored by 施乐存's avatar 施乐存
Browse files

论文:视频时长与互动表现分析



Signed-off-by: 施乐存's avatarszdytom <szdytom@qq.com>
parent 4960bb3f
Loading
Loading
Loading
Loading
+88 −5
Original line number Diff line number Diff line
@@ -42,7 +42,13 @@

// TODO: 介绍数据处理方法

进一步,我们使用 Mathematica 对数据的各项统计指标进行计算,并绘制相关图表,以揭示“每周必看”视频在不同时间段内的表现差异和趋势变化。
进一步,我们使用 Mathematica 对数据的各项统计指标进行计算,并绘制相关图表,以揭示“每周必看”视频在不同时间段内的表现差异和趋势变化。这些 Mathematica 代码通过 `DatabaseReference`  `ExternalEvaluate` 函数直接与 SQLite 数据库交互,实现数据的高效处理与分析。绘制的图表导出为高分辨率 PNG 格式,嵌入本文以辅助说明分析结果。

== 数据与代码公开

本研究所使用的 Python 爬虫代码和 Mathematica 分析代码均已公开,存储在 Git 仓库中,地址为:https://mirrors.sustech.edu.cn/git/szdytom/bilibili-ugc-anal 。研究者可自由访问和使用这些资源,以促进相关领域的进一步研究。

本研究所使用的“每周必看”数据均来自公开渠道。鉴于我们无法确认这些数据的版权归属问题,本文不提供数据的直接下载链接。研究者如需获取数据,可通过运行公开的爬虫代码自行收集。

= 研究结果

@@ -61,6 +67,7 @@ $ y = 732 x^(-1.53) $
#figure(
  image("../up-analysis/up_video_distribution.png"),
  caption: [创作者分布的幂律特征],
  placement: auto,
) <up-distribution-fig>

拟合指数为 $-1.53$  YouTube 等平台通常观察到的 $-1.2$  $-1.4$ 更为陡峭,表明 B 站内容生态的“头部效应”尤为显著。数据显示,约 $0.2%$  UP 主(上榜 20 次以上)占据了约 $20%$ 的上榜次数,而 $75%$ UP主仅上榜 $1$ 次。这种分布模式反映了B站内容生态的“赢家通吃”特性:每增加一倍的上榜次数,对应UP主数量减少约 $2.9$ 倍,意味着从“偶尔上榜”到“经常上榜”存在明显的跃迁门槛。
@@ -68,6 +75,7 @@ $ y = 732 x^(-1.53) $
#figure(
  image("../up-analysis/up_rank_cumulative.png"),
  caption: [创作者上榜次数的累积分布图],
  placement: auto,
) <up-rank-cumulative-fig>

累计分布分析(@up-rank-cumulative-fig)进一步揭示,仅 $20%$  UP 主贡献了接近 $80%$ 的上榜视频,凸显了核心创作者群体在内容生产中的主导地位。尽管生态中存在 $27$ 位上榜超过 $20$ 次的"常青UP主"(最高达 $161$ 次),但中间层UP主相对薄弱,$2$  $10$次上榜的UP主数量衰减迅速,表明B站创作者生态呈现"两极分化"结构:大量UP主依赖单次爆款,而极少数UP主能够建立稳定的内容输出机制。
@@ -83,9 +91,10 @@ $ y = 732 x^(-1.53) $
#figure(
  image("../up-analysis/up_diversity_distribution.png"),
  caption: [创作者分区专注度分布],
  placement: auto,
) <up-zone-diversity-fig>

这一分布呈现典型的幂律特征:头部($1$  $8$ 个分区)占总数的 $89.8%$($193$ 人),而尾部($>= 9$ 个分区)仅占 $10.2%$($22$人)。数据表明,超过 $8$ 个分区后 UP 主数量锐减,存在明显的“隐形门槛”。值得注意的是,$3$ 个分区构成“甜蜜点”,这样的“适度多元”策略既避免了过度专一导致的内容局限,又防止了过度分散带来的专业度稀释,集中资源打造核心竞争力,是频繁上榜 UP 主最成功的策略组合。
这一分布呈现典型的幂律特征:头部($1$  $8$ 个分区)占总数的 $89.8%$($193$ 人),而尾部($>= 9$ 个分区)仅占 $10.2%$($22$人)。数据表明,超过 $8$ 个分区后 UP 主数量锐减,存在明显的“隐形门槛”。值得注意的是,*$3$ 个分区构成“甜蜜点”*,这样的“适度多元”策略既避免了过度专一导致的内容局限,又防止了过度分散带来的专业度稀释,集中资源打造核心竞争力,是频繁上榜 UP 主最成功的策略组合。

=== UP主的生态流动性

@@ -99,17 +108,91 @@ $ y = 732 x^(-1.53) $

UP主占比的时序分析揭示了 B 站“每周必看”内容生态中持续而稳定的流动性特征。数据显示,尽管平台存在显著的头部效应,但每期仍有约三分之一(中位数 $33.33%$)的上榜UP主是首次进入榜单的新面孔,这一比例在300多期的长期运行中保持相对稳定,表明平台在建立了相对稳定但仍有活力的生态结构。

这种持续的流动性与前述幂律分布特征形成看似矛盾却实际互补的关系:一方面,头部UP主凭借稳定产出占据大量曝光机会;另一方面,平台机制持续为新创作者提供展示窗口。值得注意的是,新UP主比例并未随时间推移而显著下降,这表明"每周必看"栏目并未陷入完全封闭的循环,而是保持了对新兴创作者的开放性。这种"头部稳固、中层流动"的结构,既保证了内容质量的稳定性,又维持了生态的创新活力,为理解B站热门视频的持续生产机制提供了关键视角——热门内容的产生不仅依赖于已建立影响力的创作者,也持续受益于新鲜血液的注入。
这种持续的流动性与前述幂律分布特征形成看似矛盾却实际互补的关系:一方面,头部UP主凭借稳定产出占据大量曝光机会;另一方面,平台机制持续为新创作者提供展示窗口。值得注意的是,新UP主比例并未随时间推移而显著下降,*这表明"每周必看"栏目并未陷入完全封闭的循环,而是保持了对新兴创作者的开放性*。这种"头部稳固、中层流动"的结构,既保证了内容质量的稳定性,又维持了生态的创新活力,为理解B站热门视频的持续生产机制提供了关键视角——热门内容的产生不仅依赖于已建立影响力的创作者,也持续受益于新鲜血液的注入。

=== 创作者生态的结构启示

B 站创作者生态呈现出“头部效应显著、中间层薄弱、新入口开放”的三重特征。虽然马太效应明显,成功 UP 主的护城河深厚,但每年仍有大量新 UP 主首次上榜,表明平台仍保持一定的流动性。与国际平台相比,B站更陡峭的幂律分布($-1.53$)可能反映了中国观众口味的相对集中性、B站推荐算法对头部内容的偏好,以及社区文化中“梗”和“潮流”更易形成共识的特点。
B 站创作者生态呈现出“*头部效应显著、中间层薄弱、新入口开放*”的三重特征。虽然马太效应明显,成功 UP 主的护城河深厚,但每年仍有大量新 UP 主首次上榜,表明平台仍保持一定的流动性。与国际平台相比,B站更陡峭的幂律分布($-1.53$)可能反映了中国观众口味的相对集中性、B站推荐算法对头部内容的偏好,以及社区文化中“梗”和“潮流”更易形成共识的特点。

这些发现对理解“热门视频”的形成机制提供了重要视角:成功不仅依赖于单次爆款,更需要在 $2$  $4$ 个相关分区建立持续产出能力;同时,创作者需在专业深度与内容多样性之间找到平衡点,避免过度专一或过度分散。这种“适度多元”策略既符合平台算法偏好,又能满足用户多元化需求,成为频繁上榜UP主的共同成功要素。

== 视频时长与互动表现
== 视频时长与互动表现分析

我们还聚焦视频本身,根据其时长和互动表现数据,进行了历时性分析,以揭示视频内容特征与用户参与度之间的关系。

=== 视频时长的分布特征与离散趋势

我们使用均值、中位值和四分位数(Q1Q3)等统计指标,对“每周必看”榜单中视频时长的分布特征进行了历时性分析(@video-duration-stats-fig)。并使用 IQR(四分位距)指标和 QCD(四分位数离散系数)指标(@video-duration-dispersion-fig),评估视频时长的离散趋势。

#figure(
  image("../video-analysis/video_duration_stats_plot.png"),
  caption: [上榜视频时长的均值,中位值,四分位数及四分位距历时性统计分析],
  placement: auto,
) <video-duration-stats-fig>

#figure(
  image("../video-analysis/video_duration_qcd_plot.png"),
  caption: [上榜视频时长的四分位数离散系数(QCD)历时性分析],
  placement: auto,
) <video-duration-dispersion-fig>

总体而言,视频时长呈现显著的历时性波动与离散度扩大特征。均值从 2019 年的 $10.09$ 分钟逐渐上升至 2025 年的 $19.07$ 分钟。Q3 的上升也较为明显(从 $9.6$ 分钟升至 $18.62$ 分钟),显示出长视频比例的增加。相比之下,中位数变化相对平缓(2019  $5.34$ 分逐渐上升至 2025  $7.95$ 分钟),但也有上升趋势,而 Q1 则基本保持稳定(约 $3.0$ 分钟上下波动)。

这些数据表明,在意识到短视频赛道竞争激烈的背景下,B站鼓励长视频内容的发展,以满足用户对深度内容的需求和赛道多样化。这些政策有效地推动了内容生态逐渐向多样化时长结构转型。同时,我们观察到,仍稳定存在 $25%$ 的视频时长低于 $3$ 分钟,表明短视频内容依然具有重要市场地位。

在这一背景下,我们不难理解,视频时长的离散趋势也在逐渐扩大。IQR 指标和 QCD 指标均显示出显著的上升趋势。这一趋势表明,B站内容生态正从早期标准化短内容向多元化时长结构转型,同时B站在短视频与长视频之间寻求平衡:*用户既有对碎片化短内容的需求,也对深度长内容表现出兴趣*。平台也在逐步适配碎片化消费与沉浸式内容的双轨需求。

值得一提的是,视频时长均值在 2021 年出现了一个明显的异常点($29$ 分钟,甚至超过该年度的 Q3  $12.1$ 分钟的两倍)。这一异常主要源于 2021  7 月的第 120 期“每周必看”榜单中一个名为“冒死上传!目前B站最完整的绘画教程,包含所有绘画风格!插画|厚涂|原画|板绘!”的视频(BV1d64y197gj),该视频时长高达 $1521455$ 秒(约 $17$  $14$ 小时),这严重拉高了该年度的时长均值。该年度未见其他异常点,表明该异常为孤立事件,对实际上的整体趋势影响有限。

=== 互动行为的整体演变与分化

基于前述视频时长的演化趋势,本研究进一步分析了上榜视频的各项用户互动指标(包括弹幕、评论、点赞、投币、收藏、分享)与播放量的比值(@coin-ratio-stats-fig @danmaku-ratio-stats-fig @favorite-ratio-stats-fig @like-ratio-stats-fig @reply-ratio-stats-fig @share-ratio-stats-fig)。该比值反映了单位播放量所能激发的用户互动深度,是衡量视频“互动效率”或“观众粘性”的关键指标。历时性分析揭示了B站用户互动行为模式的显著变迁。


#{
  for indicator in (
    ("coin", "投币"),
    ("danmaku", "弹幕"),
    ("favorite", "收藏"),
    ("like", "点赞"),
    ("reply", "评论"),
    ("share", "分享"),
  ) [
    #figure(
      image("../video-analysis/" + indicator.at(0) + "_ratio_all_stats_plot.png"),
      caption: "上榜视频" + indicator.at(1) + "数与播放量比值的历时性分析",
      placement: auto,
    ) #label(indicator.at(0) + "-ratio-stats-fig")
  ]
}

纵观20192025年的数据,不同互动指标的演变路径呈现显著分化,勾勒出用户参与行为从“泛化互动”向“精准表达”与“私域留存”转变的图景。

首先,*即时性互动衰减,深度交流趋稳*:弹幕比值的下降趋势最为显著,均值从 2019 年的 $0.592%$ 骤降至 2023 年的 $0.250%$,尽管在 2025 年有所回升($0.490%$),但仍低于早期水平。这或与 B 站社区规模扩大、弹幕文化从“全民狂欢”步入“常态分层”有关,用户发送弹幕变得更审慎。相比之下,评论比值的均值相对稳定,在 $0.134%$  $0.191%$的区间内窄幅波动,中位数亦保持平稳。这表明,尽管即时性的弹幕互动可能降温,但用户对于进行相对深度的、结构化的文字交流的需求始终存在,构成了稳定的互动基底。

第二,*轻量化反馈经历“过山车”,价值型互动持续收紧*:点赞比值呈现明显的“倒U型”曲线,均值从 2019 年的 $5.68%$ 一路攀升至 2022 年的峰值 $8.00%$,随后连续三年下降至 2025 年的 $5.79%$。其早期上升与平台力推“一键三连”及培养用户点赞习惯密切相关,而近期的回落则可能意味着点赞行为的“通货膨胀”或用户对“轻量化”正向反馈的阈值提高。更具成本意味的投币比值则呈现单边下滑态势,均值从 $4.07%$ 降至 $1.83%$,中位数从 $2.92%$ 大幅降至 $1.16%$。这强烈表明,随着内容供给爆炸式增长,用户的“硬币”这一稀缺资源分配变得极为审慎,仅对价值感知极高的内容才愿意给予实质性激励。

第三,*私域留存行为稳定,社交传播效率走低*:收藏比值是所有指标中最为稳定的,均值始终围绕1.8%小幅波动。这揭示了用户“标记优质内容以备后看”的私域工具性需求具有刚性,不受社区公开互动氛围短期波动的显著影响。分享比值则呈波动下降趋势,均值从 $0.615%$ 降至 $0.420%$,说明视频通过用户社交关系链进行病毒式传播的整体效率在降低,内容消费可能更集中于站内或特定圈层。

四分位距(IQR)离散趋势的分析,进一步揭示了不同互动行为在视频间的集中度变化。

- 弹幕与投币:从普遍参与到核心聚焦。弹幕比和投币比的IQR虽有所波动,但结合其中位数的大幅下降(弹幕中位数从0.444%降至0.210%;投币中位数从2.92%降至1.16%)观察,表明能够引发高浓度弹幕讨论或获得大量投币的视频变得更加稀有,互动资源向少数“爆款”集中。特别是投币行为,其Q1值在2025年已低至0.451%,意味着大量视频仅能获得极低的硬币投入。

- 点赞与评论:分布相对稳定。点赞比和评论比的IQR变化幅度相对其他指标较小,表明用户进行点赞和评论的行为分布在不同视频间的差异度保持相对稳定。尤其是评论比,其IQR始终维持在较窄水平(约0.11-0.14),说明无论是头部还是中腰部视频,其引发评论的“效率”差异相对可控。

=== 对“热门视频”形成机制的启示

视频时长与互动表现的历时性分析为理解“热门视频”的当代标准提供了关键维度:

+ 多样化时长结构:B站内容生态正从单一短视频向多元化时长结构转型,创作者应根据内容需求灵活选择时长,以平衡碎片化消费与深度体验。

+ 互动质量重于数量:单纯追求高播放量已不足以定义“热门”。成功的视频需要能撬动更深层、更“昂贵”的用户互动。能够稳定获得评论与收藏,并能在特定节点激发高浓度弹幕或收获大量投币,成为当前热门视频更核心的特征。

+ 用户决策更加理性:投币比值的持续下降和收藏比值的稳定,共同反映了用户在信息过载下的行为模式:即时冲动性打赏减少,转而更倾向于将内容标记为个人数字资产。这对创作者的内容“长效价值”提出了更高要求。

+ 互动模式与内容时长可能存在关联:结合视频时长向多元化发展的趋势,长视频更可能通过深度内容赢得收藏、深度评论和“物有所值”的投币;而精悍的短视频则可能更依赖点赞、分享和即时弹幕引爆流量。内容策略与预期互动模式需精准匹配。

综上所述,B站“每周必看”上榜视频的互动生态正经历深刻的结构性调整。用户互动行为从早期的泛化、轻量趋向于理性、分化与深化。这对于创作者而言意味着,制造“热门”不仅需要吸引眼球,更需要创造能够经得起理性考量、值得用户投入“高成本”互动(如时间、硬币、收藏夹位置)的内容价值。这也预示着 B 站的内容竞争,正从流量争夺进阶到用户心智与价值认同的更深层次竞争。

#pagebreak()

+2 −0
Original line number Diff line number Diff line
@@ -33,6 +33,8 @@
  set footnote(numbering: "注1")
  show footnote: set text(9pt, font: font.fangsong)
  show figure.caption: set text(9pt, font: font.fangsong)
  set enum(indent: 2.5em)
  set list(indent: 2.5em, marker: sym.square.filled.small)

  show heading: body => {
    v(1em)
+14 −2
Original line number Diff line number Diff line
@misc{Bilibili_API_collect,
  author = {SocialSisterYi,  等},
  author = {社会易姐QwQ and 晨叶梦春 and Session小胡 and z0z0r4 and others},
  title = {哔哩哔哩 - API 收集整理},
  howpublished = {\url{https://github.com/SocialSisterYi/bilibili-API-collect}},
  note = {Accessed: 2025-12-18},
@@ -19,3 +19,15 @@
	journal={arXiv preprint arXiv:2511.21631},
	year={2025}
}

@article{He_Haixiang_2025,
	author = { 何海翔 and  夏临 },
	title = {使用与满足理论视域下大学生B站弹幕文化解析},
	journal = {当代电视},
	volume = {},
	number = {06},
	pages = {76-79},
	year = {2025},
	issn = {1000-8977},
	doi = {10.16531/j.cnki.1000-8977.2025.06.011}
} 
+127 KiB
Loading image diff...
+136 KiB
Loading image diff...
Loading