IAM系统调研⌗

记录下最近对业界开源 IAM 系统的调研， IAM: IdentityAccessManagement，简单来说就是用户身份标识与访问管理，通常涉及两个部分：

认证(Authentication): 通常会涉及到用户登录等操作，用于识别 你是谁
授权(Authorization): 识别身份后就是授权的过程，用于管理 你能做什么

认证( Authentication )与授权( Authorization )⌗

正常的访问中，我们都会涉及到两个阶段：

认证：你是谁
授权：你能干什么

认证⌗

上面已经提到，所谓认证简单来说就是“你是谁”，无论是颁发凭据的一方还是校验的凭据的一方，都是基于这个目的而行动。常见的认证手段有：

密码
验证码
生物识别（指纹，人脸）
证书
第三方平台(OAuth2, OIDC)

而常见的认证协议:

Kerberos: 比较完全
LDAP: 轻量，还需要SASL去完善认证的流量

授权⌗

授权是在认证之后识别出你能干什么，这里又分为两类知识：

授权模型：你怎么分配权限，通常用于系统资源的分配，比如某个用户是否具备某类资源的操作权限。
授权协议：你怎么授予他人使用自己的权限资源，通常用于 用户资源 在开放平台等场景使用，

常见的授权模型(复杂度逐步变高)：

ACL(Access Control List): 将一组访问权限授予某个账号，类似文件系统的权限
RBAC(Role Base Access Control): 类似 ACL，但是不再授予给账号，而是角色，最后再将角色和账号绑定，更为灵活。但是缺点也很明显，多了一个角色管理对象。
Zanzibar: 谷歌云平台的权限控制模型，建立了一种他们自己的DSL(Object, Subject, Relation, SubjectSet 等)，非常灵活，但是有一定的认知成本。
ABAC(Attribute Base Access Control): 基于属性的控制，相比 RBAC 的区别在于授予权限的对象变成一类满足特定要求的账号，比如某个属性大于 X 的账号，给予 Y 权限。该模式最为灵活，但是配置太过复杂，因此业界几乎没用使用。

常见的授权协议有：

OAtuh2.0
OIDC(OpenID Connect)

接下来，我们针对几种实际场景来看看这些技术的使用：

用户登录: 使用上面提到的认证方法。
内部用户登录:
- SSO: 在统一入口登录后，利用OIDC or OAuth2 协议来获取登录信息
- 独立登录页: 可以通过SDK也能达到底层数据互通的效果，但是由于登录态维护在各个系统，因此登录态无法互通
用户资源授权:
- 用户显式授权: 这里通常都是其他系统需要访问特定系统的用户资源，那么一般都是让用户在页面授权，类似QQ, 微信登录
- 服务账号: 在一些底层系统的权限控制中，系统的用户可能是另一个系统，那么它想控制的是就是自己的系统权限，可以通过服务账号(ServiceAccount)的概念，新建服务账号后对服务账号进行业务维度的授权，随后系统使用服务账号进行访问

OAuth2.0⌗

OAuth2.0 协议是针对授权流程的标准协议，不包括验证，OIDC 是在 OAuth2.0 之上进行的补充，包含了用户身份信息。有关它的详细内容在 [RFC6749] https://tools.ietf.org/html/rfc6749，同时还有针对撤回Token和自省的 RFC7009、RFC7662。撤回很容易理解，自省( introspection )指的是验证 token 有效性。以及为了安全而生的 OAuth2.0 PKCE([RFC7636])。

这里简单介绍下 OAuth2.0 定义的四种模式：

AuthorizationCode Grant: 授权码模式是最常见也最安全的一种模式，简单来说，接入方( 或者叫应用 ) 通过凭据换取授权码，再通过授权码换取 Token，但是过程中有可能被中间人劫持，所以有了 PKCE 来拓展该模式，保证它的安全
Implict Grant: 隐式模式是授权码模式的简化，去除授权码而直接返回 Token，但是不返回 RefreshToken，这个模式同样也是不安全的
ResourceOwnerPasswordCredentials: 资源拥有者密钥模式即接入方使用用户本身的密钥来换取凭据，这个一定要接入方是可信的，比如用户的桌面。
Client Credentials: 这个是接入方以自己的密钥登录的场景。

关于各个模式的详细流程可以查看原生文档，也可以看下 DigitalOcean 的教程，点击。另外有关于 OAuth2.0 除了 PKCE 的授权码模式外都不安全的文章，查看文章提到了 ROPC 模式是 OAuth为了从 1.0 升到 2.0 但是为了兼容某些 IETF 联盟的大型传统公司而做出的让步， IETF 和一些熟悉 OAuth 的人都不推荐使用这种模式，这种模式可以用于几种少见的常见：

遗留应用向 OAuth 转型
无浏览器设备，不过这个部分目前 OAuth 正在起草一个新的流程来补全

关于现在应用的 OAuth 实践，点击这里

当然最后这两个部分都需要一个动作——鉴权（Introspect），用于检测颁发的凭证是否有效（包括你的身份识别与权限校验）。

下面是找到的一些开源方案：

casdoor(BSD): 后端为 go，存储为关系数据库(通过xorm支持), 前端为 react，项目开始于 2020 下半年，功能相对比较齐全，认证与授权都支持，授权基于Casbin实现，大致看了下项目结构，http框架使用的beego，将 session 信息维护到了数据库中，看起来有点乱，页面也丑了一点。不过它还打通了部分 OOS 用于存储用户的头像信息，算是一个不同之处。
logto(MPL): 前后端都是TS, 前端框架为 react，开始于 2021 年下半年，如项目名字所示，该项目仅支持 认证 而不支持 授权，但是界面非常时尚，并且把登录页的调整也考虑了进去，比较专注，但是后端使用 NodeJS 的话，不禁对它的性能会有点担忧（虽然说多时候时候服务的性能都取决于开发者，但是Nodejs的单线程模型与解释执行这两点比起具备CSP模型的go来说会有不小的差距。）
arkid(GPL): 基于python的系统，web也直接通过服务端渲染来实现，项目开始于2019年下半年，感觉没什么特别亮点。
Kanidm(MPL): 基于 rust 的 IM 系统，和 logto 类似，项目开始于 2018 年下半年，但是文档仍然显示 in progress，让人不禁怀疑起它的活跃度（虽然代码一直都有人在迁入中）
keycloak(Apache2.0): 基于 java的IAM方案，web不确定如何构成的，依赖
authelia(Apache2.0): 基于 go 的老方案了，从2016年尾开始，活跃度一直都还挺高，可惜也只是一个 IM 方案，backend为 fasthttp, web 为 react，
Ory 套件：基于 go，包含很多套件，其中 hydra 我有使用过，设计理念非常新颖，Ory套件包含IAM的多数能力，并且各个组件都是相对松耦合的。有意思的是，它的AM组件(keto)是基于 google paper ——Zanzibar（google 用于管理google数百个云上资源，如日历、设备、地图、相片等的通用策略）实现的。

另外在 casbin 项目下有个叫 awesome-auth 的项目，记录了很多关于认证与授权的项目，其中有框架类型的、也有项目类型的，这里不展开了。

总的来看，业界虽然有很多开源项目，以及 IDaas 这个赛道有几家公司都想参与进来，但是我没有看到真正经过海量数据验证过的方案，虽然 casdoor, logto 等年轻方案看起来都很不错，但是它们并不是孵化于大型项目中，使用案例也还没有那么充足，让人不禁担心它的可靠性。

这里 Identity 要区分两个很重要的场景：

外部：一般都是产品的用户，通常是一个C端产品才会具备的用户。在开放平台的场景下，也可能是程序、脚本等。
内部：公司内的用户，它可能是一个具体的员工，在开放平台的场景下，也可能是程序、脚本等。一般都是公司内部的系统，比如ERP，运营平台等等。

在不同的场景下，我们又可以进行功能细分：

外部：
- 一键登录: 包括手机验证码、微信、QQ以及其他社交平台的登录
内部:
- SSO: 对于企业内部来说，具备一个SSO对所有员工都是福音
内外部通用:
- 登录: 最原始的密码登录
- 授权(OAuth2/OIDC): 对于开放平台来说，可能是对内，也可能是对外开放的，这里注意授权和访问控制不同，一个是控制某个用户的权限，而另一个是将用户权限放开，因此AC可能权限粒度会很细，而授权来说，一般粒度会比较粗，通常都是针对产品级别的，比如 微信-联系-读取 权限，而且最后都换转化为对 API 的控制（甚至一开始就是），一般通过网关来完成，而访问控制通常都是放置在服务中。
- 访问控制(AccessControl): 内部的SSO，以及开放平台都需要这个能力，相关的实现有ACL(AccessControlList), RBAC, Zanzibar, ABAC等(复杂度由低至高)

Hydra⌗

hydra 是一个实现 OAuth2.0 的开源项目，它抽象了认证规范，将授权和认证实现解耦，非常不错。它属于一个开源组织 Ory，它下面还有几个和鉴权相关的项目。这里简单介绍下一些要点

容器默认监听 4444 和 4445 端口，一个 public ，一个 admin，public 用于暴露 OAuth2 协议约定的标准端点，admin 用于管理 Hyrdra，更多细节可以查看 API文档
使用前先查看下项目的一些限制条件，最关键的一点应该是要求 Mysql版本必须为 >= 5.7 ，或者使用MariaDB
配置可以使用配置文件或者环境变量，常见命令如下

// 命令行参数
-c path/to/config.yaml or --config path/to/config.yaml
--dangerous-force-http // 允许 RedirectURI 为 http，还需要配合 dangerous-allow-insecure-redirect-urls 来使用
--dangerous-allow-insecure-redirect-urls=http://vincixutest.woa.com/auth/accept,http://scrtest.ied.com/auth/accept

// 环境变量
SECRETS_SYSTEM=$SECRETS_SYSTEM -- 配置系统密钥，用于加密
DSN=$DSN -- 数据链接
URLS_SELF_ISSUER=https://localhost:9000/ -- Hydra 部署的Origin，用于签发Issuer
URLS_CONSENT=https://localhost:9001/ -- 实现认证规范的确认授权端点
URLS_LOGIN=https://localhost:9001/ -- 实现认证规范的登录端点

执行数据库迁移，Hydra 维护了一个数据库的版本管理功能，集成在同一个二进制内，可以使用以下的命令开启数据库迁移

hydra migrate sql --yes $DSN