查看原文
其他

Star History 2022 年度精选|Data, Infra & Tools 开源项目

mi Bytebase 2023-01-28

继上篇总结了 2022 年有趣的前端开源项目后,Star History 今天来总结一下 2022 年在 Data, Infra & Tools 这一栏目中眼前一亮的开源项目。👀

*注:以下按字母顺序排列。


Buf

https://github.com/bufbuild/buf

Buf 是一个神秘而低调的公司,base 在多伦多,专注于改善 Protocol Buffers 的开发者使用体验。他们的使命是废除 REST/JSON,并通过 Protobuf 将整个行业推向 schema 驱动的研发模式。他们的工具 the buf CLI 和 Buf Schema Registry 能够帮助工程师将大部分时间和精力从管理 Protobuf 文件转向实现功能和基础设施。
Buf 在 2021 年底完成了 $6,800 万的 B 轮融资,对于前后四轮融资,他们都保持了低调,唯一来自官方的通稿(https://buf.build/blog/an-update-on-our-fundraising)也表示希望大家关注的是基于 Protocol Buffers 的 API 生态系统。🤔

Bytebase

https://github.com/bytebase/bytebase
前面提到的 Buf 针对的是 API 的 Schema,而 Bytebase 针对的则是藏在 API 背后的,数据库的 Schema。虽然市场有大量的商业 / 开源数据库引擎,但围绕可靠、一致、可审计的应用数据库 schema 变化的工具却屈指可数。直到今天,许多团队仍旧直接连接到生产数据库修改数据。💥
  • 类似 GitHub / GitLab 管理代码变更,Bytebase 提供了 GUI 来管理数据库的变更;

  • 类似 Figma 帮助设计师团队协作,Bytebase 帮助 DevOps 团队协同管理数据库;

  • 类似 Terraform 打造 Infrastructure-as-Code,Bytebase 打造的则是 Database-as-Code。
Bytebase 是一款为 DevOps 团队准备的数据库 CI/CD 工具(Database-as-Code),专为开发者和 DBA 打造,也是唯一被 CNCF Landscape 收录的 Database CI/CD 产品
吉祥物拜特和贝斯(形象分别来源于 Bytebase 的 B 和数据库)也很可爱啦。

Casdoor 

https://github.com/casdoor/casdoor
Casdoor 是一个基于 OAuth 2.0 / OIDC 的集中认证 / SSO 平台。支持普通的账户密码注册登录,也支持各种第三方认证,提供登陆界面的身份访问管理平台。Casdoor 负责 Authentication 部分,同时它还可以和它的姐妹开源项目,负责 Authorization 的 Casbin 集成。

Dagger

https://github.com/dagger/dagger
Dagger 是 Docker 创始人 Solomon Hykes 2022 年推出的新产品 :一个 CI/CD 流水线开发工具包,目的是为开发者解决 DevOps 流程上的问题。宣布公测版的同时,创始人也宣布 Dagger 已经获得 $2,000 万 A 轮融资。
各个平台的流水线配置各异,开发团队竭力拼凑出了难以扩展或迁移到其他云平台的部署流水线,这不仅没有节省人力和时间,反而使得部署体验令人痛苦。使用 Dagger 的 Devops 工程师会得到一套标准化组件,以此为基础,工程师可以描述自己的流水线、并将其中各个环节进行对接(想象玩乐高),同时全部以纯代码形式实现,而这一套组件在任何云上都能可靠地运行。
视觉效果充满了美式复古,也同时延续了 Docker 的风格 ⚓️

DuckDB

https://github.com/duckdb/duckdb
DuckDB 与 SQLite 架构类似,它也是个可嵌入数据库。不同的是,SQLite 主要集中在 OLTP 事务,而 DuckDB 旨在成为 OLAP 事务的 SQLite 对应数据库。前不久宣布 $4,750 万 A 轮融资的 MotherDuck 就是基于 DuckDB 打造的。

Meltano

https://github.com/meltano/meltano
Meltano 于 2018 年在 GitLab 创建,原本是为 GitLab 的数据和分析团队打造的开源工具。它是 DataOps 时代的数据平台,旨在帮助数据团队组装数据平台上的各种产品,管理整个数据平台的生命周期,可进行版本控制、代码审查、持续集成和部署 (CI/CD)以及容器化等。
2021 年从 GitLab 独立出来成为一个初创公司。源代码最初托管在 GitLab,不过 2022 年中已从 GitLab 迁移到了 GitHub,不久,也收获了 $1,240 万的种子轮融资,并推出了 Meltano 2.0(去年是个大年呀)。

Neon

https://github.com/neondatabase/neon
Neon 是一家为开发者提供 Serverless Postgres 数据库的初创公司,获得了 $3,000 万的 A 轮融资。除了产品创新,他们的视觉效果也可以说是标新立异:可爱的 Postgres 吉祥物变成了真的大象。
Neon CEO Nikita Shamgunov 曾是微软 SQL Server 和 Meta 的工程师,之后创立了 SingleStore。2021 年,他与 Heikki Linnakangas(之前是 Postgres hacker)和 Stas Kelvich(之前在 Yandex 数据库团队)一起创立了 Neon。
他们意识到 Postgres 可以通过将存储和计算的分离,以便在云环境中更便宜、更高效。它允许我们围绕性能、可靠性、可管理性和成本来设计服务。Neon 的云无服务化 Postgres 服务(Serverless Postgres built for the cloud),具有动态扩展的计算和存储。计算节点只在有连接传入时被激活,并在不活动期间会自动关闭。而在存储上,冷数据可以卸载到 S3 以节省成本。
Neon 除了提供 Serverless 外,他们的另一大特色是关注开发者工作流 (Developer Workflow),他们最近刚推出了 Branching 能力,使得用户可以像使用 Git 代码分支一样管理数据库的分支。

Opa

https://github.com/open-policy-agent/opa
Open Policy Agent (OPA),是一个全功能的策略引擎,旨在将策略决策从软件中提取出来,统一不同技术和系统的策略执行。值得一提的是,它是一个 CNCF 孵化(2021 年毕业)的项目。
OPA 的策略使用 Rego,一种高级声明性语言来表达。Rego 使定义策略变得非常容易,方便用户像写代码一样来配置策略(Policy-as-Code),比如解决这类问题:Bob 是否被允许对 `/api/v1/products` 执行 GET 请求?他有权限查看哪些记录?
看了一下 OPA 的 Adopter.md,发现将 OPA 运用于生产环境的大牌用户已经不少了:Netflix, Pinterest, T-Mobile 等等。策略的语法一直以来没有被统一,导致大家都不得不重复造轮子,OPA 很有希望改变这一局面。

Steampipe

https://github.com/turbot/steampipe
Steampipe 可以用 SQL 即时查询你的云服务(如 AWS、Azure、GCP 等),而不需要数据库,去年一月发布了 Steampipe Cloud。
去年 10 月 Steampipe 的 star 数暴增应该是因为在 Hacker News(https://news.ycombinator.com/item?id=33034351)爆火了一下,话题主要围绕在「好好学 SQL 不会错 / 围绕 SQL 建立产品的大方向至少不错」。

Tier

https://github.com/tierrun/tier
Tier 是一个可以管理你 SaaS 应用程序的整个定价和计费工作流程的工具。
创始人发了 Hacker News(https://news.ycombinator.com/item?id=33429972),随后 Tier 也出名了。
SaaS 产品定价是一门学问,但是大家应该也都清楚,迭代定价并不是个灵活的 task,它往往被复杂的工作流程和隐藏的跨组织依赖性束缚着。很多 startup 只为他们的产品选择一次价格,然后就不变了。
Tier 对于如何实现定价做了顶层设计,可以做到改变定价模式,但不需要改变应用程序代码或业务流程(Pricing as Code)。创始团队对于定价有深入的思考,还为此搭建了 https://priceops.org/ 的网站,阐述了 The 5 Pillars of PriceOps。

Star History 刻意挑选了一些相对不那么有名,但是在社区中冉冉升起的项目,我们看到 Data & Infra & Tools 类亮眼的项目可以分成两大类:
  • 垂直领域的创新,数据库引擎是其中最热门的方向,比如这次的 DuckDB 以及 Neon。

  • 横向的统一,标准化:

    • Buf 是对于 API 开发的标准化。

    • Bytebase 是对于数据库开发的标准化。

    • Casdoor 是对于不同认证源的标准化。

    • Dagger 是对于不同流水线部署的标准化。

    • Meltano 是对于大数据库平台的标准化。

    • Opa 是对于策略配置的标准化。

    • Streampipe 是对于访问不同云服务商下的云资源的标准化。

    • Tier 是对于 SaaS 定价基础设施的标准化。
(~ ̄▽ ̄)~ 也期待这些项目在新的一年表现,帮助团队来驾驭日趋复杂的研发设施。

DB-Engines 2022 年度数据库排名和趋势解析
别再让你的工程师用 Navicat 连数据库了
喜喜喜|开源先锋 + 新锐技术先锋企业 + 最受开发者欢迎技术活动
【5000 字长文】从 S3 到 DataZone,AWS 用 16 年讲完一个数据的故事

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存