元数据刮削就是一笔糊涂账
元数据刮削就是一笔糊涂账
注意
本文所抛出的观点并未经过严谨的论证,且容易引起争论。读者们看个乐就是,文中的论述莫要当真。换句话说,“这家伙叽里咕噜说什么呢?”
虽然主要差异在于思维方式——毕竟我还是更习惯基于文件和目录的树形资源管理,但在讨论之前我不得不承认:元数据的收集整理(即刮削)相对来说很有必要。听起来就……左右脑互搏,对吧?本文之所以是篇"无病呻吟",正因为犯这个病的大抵只有我一个。
我的观点很简单:元数据有用,但并不好用。要说什么方案更好?对不起,我也不知道。
首先还是说说为什么值得肯定。不说别的,至少分类的角度多了。同是音乐,我可以看专辑、看艺术家,当然也可以直接随便 roll 一些单曲来听。从用户体验上说,图像就是比冷冰冰的文字更抓眼球,一排排专辑封面、电影海报总要好过全是文件夹图标、甚至只有一排排文件名、文件路径的。
但……为什么我又要攻击它呢?因为用户体验好了,管理体验就要折磨。
现如今的媒体库,基本上按影视、图像、音乐、文档分类,工具选用上属于没什么平替。论及私人图书馆总绕不开 Calibre,论音像库讨论比较多的就 Jellyfin、Emby、Plex(姑且不讨论品牌家的原生工具,毕竟我没钱)。这些工具对于传统的音像、图书资源支持非常好,只要刮削得当,通常能得到比较干净的媒体库。是的,《只要刮削得当》。
然鹅事实上,光是音乐专辑的刮削就足以令我恼火。国内原生对音乐元数据的刻写做得比较好的可能就网易云,何况网易云也并不全对;有些音乐平台下载的歌曲文件甚至莫得元数据,需要手动刮削。那么刮削用什么呢?有文章推荐 MusicTag,然鹅同是从网易云那刮削,下载下来本是《紫罗兰永恒花园 OST》的曲目能给它识别成《凹凸世界五周年》,也是看笑了。

那国外平台呢?更是有相当一部分扫不出来。有些作者也不过是兴趣使然、随便做做,别说全平台了,能当专辑、EP 发到某一个平台上都已经烧高香了。这种叫冷门资源。还有一些歌曲能在 Spotify、SoundCloud 找到,但数据库网站就是没有收录。可不要认为比例不多,musicbrainz 扫不出来的歌占我歌库的 。手动录入又十分繁琐,不就只能凑合用了,好用吗?实则不然。
另一方面,影视、音乐、图书的分类并不能兼顾新兴媒体类型,比如音声,比如网文。豆瓣或许能够一定程度上打打辅助,那我问你,NSFW 资源呢?遗憾的是,我维护的大部分媒体都是 NSFW 的。这类资源刮削没有门路、媒体类型不好界定,组织起来尤其折磨。DLsite 上的同人音声尚有dvtag,国内作者通过订阅、打赏分发的音声又要如何应对?视频网站上薅下来的视频是可以有元数据,那些通过网盘分发的 MMD 呢?就很烦,哥们。
总而言之,私以为媒体资源的元数据就是一笔糊涂账,很大程度上资源组织依然仰赖人工,对我个人而言体验并没有多少质的提升,反倒因为刮削需要解决的种种问题而身心俱疲。
话又说回来,我看多数的资源网站,基本采取论坛体、博客体、挂 Alist 这几种形式,或许也表明刮削比起长痛、短痛,更像是持续的剧痛(规模较大、源源不断、出处难辨)。