引言越来越多的社交软件通过分析用户信息数据来推送相应的推荐内容或广告。随着推送目的性的增强,用户对于这个功能从最初的欣喜逐步变为厌烦,对于个人数据的保护也逐步得到重视。但只要社交软件处于中心化的管理下,用户就处于黑盒之中,无形地将其使用偏好拱手给了软件方。这样也衍生出了去中心化加上社交的新模式,而BlueSky就是其中之一。
融资背景
Bluesky于2023年7月6日进行种子轮融资,金额为800万美元。并于2024年10月25日进行A轮融资,由Blockchain Capital领投,SevenX Ventures、True Ventures、Alumni Ventures跟投。
团队Jay Graber 是 Bluesky 首席执行官,曾担任 Zcash 和区块链公司 Skuchain 软件工程师。
创始人之一的Jack Dorsey 是 Twitter 的联合创始人和前CEO。他还是 Square以及 Block 的CEO兼董事长。Jack Dorsey 被公认为时代杂志的 100 位最具影响力的人之一,并被 MIT’s Technology Review 评为 35 岁以下的杰出创新者。
项目介绍Bluesky是一个类似X和Facebook的社交应用程序。Bluesky 于 2023 年 2 月推出了仅限邀请的测试版程序,在测试版开放后的之后 20 个月内注册用户数量增长至超过 1000 万人。Bluesky Social PBC(公益性公司)负责开发官方客户端应用并运营核心服务;客户端和多个服务器端组件是开源的,采用 MIT 和 Apache 2.0 双重许可。所用协议由开放规范定义。系统的多个部分(例如信息流生成器和替代客户端)由独立第三方开发和运营。
Bluesky旨在构建一个新的社交网络基础,它让创作者独立于平台,让开发者自由开发,让用户在他们的体验中做出自由选择。其“官方”客户端应用支持 iOS、Android 和 Web 版本。用户可以通过回复、转发或点赞来与帖子互动,也可以关注其他用户。默认情况下,用户有两个信息流:一个按时间倒序显示关注账户的帖子,另一个推荐全网热门内容。用户还可以选择其他展示不同主题内容的替代信息流。
核心功能——AT ProtocolBluesky是基于AT协议(AT Protocol)开发的,这使得Bluesky能够给用户提供数据主权,将用户的所有社交信息融为一个整体。或利用非黑盒性质的算法,避免给用户提供无关的推荐和广告。
AT Protocol项目对于社交协议开发者来说,AT协议能够提供模块化社交应用程序的开源框架,是开发者能够更轻松、专业的部署程序。 AT 协议旨在支持多种社交模式,而不仅限于 Bluesky。例如,除了 Twitter 风格的微博应用,AT 还可以用于实现 Reddit 风格的论坛、带有评论的长文博客,或特定领域的社交应用,如链接分享或书评。所有这些应用可以共享相同的用户身份、社交图谱和用户数据存储服务器。
在AT协议的基础下,Bluesky的主要功能如下:
自定义信息流与算法选择
自定义信息流与算法选择漫画图
在日常使用一些社交软件的过程中,项目方的推荐算法一直是使人又爱又恨的功能之一。一些社交软件的赢利点建立在投放广告上,所以也会使用特殊的黑盒算法强制推送热门或广告相关的内容。
而在一些去中心化的社交网络只提供来自用户关注账户的倒序时间线信息流,以此抵制主流社交网络中使用的不透明推荐算法。例如,Mastodon 宣称自己“没有算法或广告来浪费你的时间”。
而在Bluesky认为问题并不在于算法本身,而在于那些中心化控制且不透明的算法,这些算法削弱了用户的自主权,优先考虑用户参与度而忽视其他因素,例如通过推广争议性帖子来吸引注意力。好的推荐算法可以帮助用户发现对他们有意义的内容,并找到新的关注对象——这对刚加入平台的用户尤为重要,因为他们尚未关注很多账户。推荐算法也有助于突出特定主题的内容,而关注用户意味着看到该用户所有的帖子,这些帖子可能涉及多个主题,并不一定都对所有关注者有吸引力。我们的目标是提供一个开放、多样化的算法市场,让社区能够根据自身需求调整系统,用户也可以更加自主地选择如何分配他们的时间和注意力。
Bluesky Social PBC 提供了一些官方的信息流算法,同时允许任何人创建自己的信息流生成器。目前已有数万个自定义信息流被创建。信息流生成器可以使用任意标准来选择其内容,通过引入自定义信息流和和算法选择后,用户可以根据个人喜好来选择自己想要的内容推荐模式。
用户数据主权
用户数据主权漫画图
Bluesky 另一个相较于传统社交软件的有点在于其给予用户完整的数据掌控权。用户可以决定自己的创作是否可以用于商业用途,而不是被平台或第三方无偿使用。这种对数据的主权让用户感到更加自由,特别是对创作者来说,能确保其知识产权不会被侵害。
据白皮书介绍,用户希望发布的所有数据都会被添加到他们的仓库中,该仓库存储一组记录。每当用户执行某个操作(如发帖、点赞他人帖子、关注他人等)时,这一操作就会成为其仓库中的一条记录。记录采用 DAG-CBOR编码,这是一种限制性的 CBOR格式,具有紧凑的二进制数据结构。记录的架构由词典(Lexicon)定义,仓库中可以包含来自多个不同词典的记录,表示用户在不同社交模式下的行为。媒体文件(例如图片)存储在用户仓库之外,但会通过 CID(基本上是一种加密哈希值)从仓库中的记录进行引用。同样,对其他仓库中的记录的引用(例如标识被点赞的帖子)也包括它的 CID。
每个用户账户有一个仓库,包含用户执行的所有操作,除了用户明确删除的记录。个人数据服务器(PDS)托管用户的仓库并将其作为网络服务公开。
用户仅更新自己的仓库。例如,如果用户 A 关注了用户 B,这只会在用户 A 的仓库中生成一条关注记录,而不会更改用户 B 的仓库。要找到所有关注用户 B 的人,需要索引所有仓库的内容。这个设计类似于网页中的超链接:很容易找到某一网址页面中的所有出站链接,但要找到所有指向该页面的入站链接则需要整个网络的索引,这通常由搜索引擎维护。
个人数据服务器(PDS)
主要服务提供商与数据流之间的关系图
个人数据服务器(PDS)负责存储用户的数据仓库和相关媒体文件,并允许任何人通过HTTP API查询其托管的数据。此外,PDS还通过WebSocket提供实时的更新流,让用户能够实时获得仓库内新增或删除的记录(如帖子、点赞、关注等)的低延迟通知。
为少数用户托管PDS所需的计算资源很小,即使这些用户拥有大量关注者。因此,想要自行托管PDS的用户可以选择在云端的低成本虚拟机上运行,甚至可以使用连接到家用路由器来实现。
PDS运营商通常会执行一些基本的内容审核,删除服务器上托管的任何违法内容。然而,在AT协议系统中,PDS层的审核审核重要性低,因为主要的内容审核职责由系统中的其他角色承担——例如标签服务和信息流生成器。这种分离允许不同的群体分别提供服务器托管和审核服务。
标签服务和内容生成器
AT 协议将系统中“有主见”的部分分离成独立服务:标签服务(Labelers)和内容生成器(Feed Generators)。标签服务输出内容判断流(例如“该帖子为垃圾信息”),而内容生成器返回已选择包含在自定义内容流中的帖子 ID 列表。用户可以在客户端中选择自己想使用的内容流和标签服务。
结语与X和Facebook等传统中心化社交平台相比,Bluesky给用户和开发者提供了更多选择的社交应用工具。随着传统社交世界对用户主权和数据掌控的深入,Bluesky和AT协议这类保护用户数据、弱化恶性广告、聚合社交数据的去中心化平台会逐渐地替代传统社交协议。