#0123 当 AI Agent 遇上硬件钱包：能做什么？怎么做？

type

Post

status

Published

date

Feb 17, 2026

slug

30aa745569bb81619a13df91c32b8a0a

summary

你有没有想过一个问题：AI Agent 已经能帮你读新闻、做分析、写报告了，但涉及到链上资产，它能做什么？答案是——能做的比你想象的多得多，但有一条铁律不能碰：私钥签名必须你亲手确认。

当 AI Agent 遇上硬件钱包：能做什么？怎么做？

你有没有想过一个问题：AI Agent 已经能帮你读新闻、做分析、写报告了，但涉及到链上资产，它能做什么？

答案是——能做的比你想象的多得多，但有一条铁律不能碰：私钥签名必须你亲手确认。

这不是限制，这是整套系统最值钱的地方。

为什么是硬件钱包？

先说清楚前提。我最近在折腾的方案是把 OneKey Classic 1S 通过 USB-C 常驻连接到我的服务器上，让 AI 助手系统能直接跟它交互。

OneKey Classic 1S 的核心规格：

双 EAL 6+ 安全芯片，抗物理篡改和侧信道攻击

USB-C 连接，支持蓝牙

开源固件，支持 BTC、ETH、SOL 等主流链

黑白屏 + 物理按键确认

为什么不用软件钱包？一句话：软件钱包的私钥在内存里，服务器被攻破等于资产归零。 硬件钱包的私钥永远不离开芯片，即使整台电脑沦陷，攻击者也签不了一笔交易。

为什么不用交易所 API？交易所能全自动化，但你的资产在别人手里。FTX 的教训还没凉透呢。

所以最终的架构很清晰：AI Agent 负责「看」和「想」，硬件钱包负责「签」，你负责按那个按钮。

七个真实场景：Agent + 硬件钱包能干什么

这是本文的核心。不是畅想未来，是现在就能落地的东西。

1. 多链资产仪表盘——你到底有多少钱？

问题： 你的 ETH 在主网，BTC 在比特币链，SOL 在 Solana，还有一堆 ERC-20 代币散落各处。每次想知道总资产，得开四五个网站手动加。

Agent 怎么做：

硬件钱包通过扩展公钥（xpub）可以派生出你所有链上的地址——这个过程不需要私钥，也不需要你按确认键。Agent 拿到地址后，通过 RPC 节点（Alchemy、Infura 或公共节点）查询各链余额，再用实时汇率折算成法币。

整个过程全自动，定时执行，比如每 4 小时刷新一次。

价值在哪：

你的 AI 助手每天早上给你推一份资产快照：「BTC 0.5 个，ETH 3.2 个，SOL 150 个，总计 $xxx，较昨日 +2.3%」。不用打开任何 App，不用手动操作，一条消息搞定。

而且因为数据结构化了，Agent 可以做趋势分析——「你的 ETH 持仓占比从 40% 涨到 55% 了，要不要再平衡一下？」

💡 这是所有后续场景的基础。没有准确的资产数据，后面的监控、策略都是空中楼阁。

2. 链上异常监控——有人动你的币了

问题： 链上世界 24 小时不停，你总不能盯着区块浏览器不睡觉吧？授权了一个可疑合约、被钓鱼签名了一个恶意 approve、或者地址被标记——等你发现的时候，可能已经来不及了。

Agent 怎么做：

Agent 每 30 分钟扫描一次你的地址，监控几件事：

大额转入/转出：超过阈值立刻告警

异常 Token Approve：有人给你的地址做了无限额授权？马上通知

新合约交互：你的地址跟一个从没见过的合约产生了交互

余额剧变：上次查是 10 ETH，这次变成 2 ETH，不管什么原因先告警

数据源可以是 Etherscan API、Alchemy Notify 的 webhook，或者直接查 RPC 节点的交易记录。

价值在哪：

安全这东西，平时觉得多余，出事了才知道值钱。一个全天候的链上哨兵，成本几乎为零（就是一些 API 调用），但能在关键时刻帮你抢到反应时间。

真出了事，Agent 还能立刻帮你构造紧急转移交易——把资产从可能被盗的地址转到安全地址。当然，签名还是得你自己按。

3. DCA 定投——让 Agent 帮你执行纪律

问题： 定投最大的敌人不是策略，是人性。涨了不敢买，跌了想多等等，最后就是什么都没做。

Agent 怎么做：

你设定一个策略：每周三买 0.05 ETH，用 USDC 在 Uniswap 上兑换。

Agent 到了时间点，自动做这些事：

检查 USDC 余额是否足够

查询 Uniswap 当前价格和滑点

构造一笔 swap 交易（包括合理的 gas 和滑点保护）

把交易放进待签名队列

给你推一条消息：「DCA 交易已构造：用 xxx USDC 买入 0.05 ETH，当前价格 $xxxx，滑点 0.3%，请确认」

你看一眼，觉得没问题，走到设备前按一下确认键。完事。

价值在哪：

Agent 帮你消除了执行层面的摩擦——策略制定是你的，市场判断是你的，但那些查价格、算 gas、构造交易的脏活累活，全部自动化了。

而且因为最终有物理确认环节，你不用担心策略出 bug 导致买错了什么。每一笔都过了你的眼睛。

💡 这个场景的技术难度比前两个高不少，因为涉及 DEX 合约调用。但一旦跑通了，同样的框架可以复用到任何链上交易。

4. 空投批量 Claim——别让钱烂在链上

问题： 你可能同时符合五六个空投的资格，每个都要手动去官网连钱包、点 claim、确认交易。费时费力，有些还有时间限制。

Agent 怎么做：

Agent 定期扫描主流空投信息源（链上快照数据、项目官方公告），交叉比对你的地址是否在白名单里。发现有资格的，自动构造 claim 交易。

然后在你方便的时候，集中确认。

这里有个细节值得说：硬件钱包不支持真正的批量签名。 每笔交易都需要你在设备上独立确认。但 Agent 可以帮你做「快速连续确认」——把所有 claim 交易排好队，你在设备端一笔一笔快速按过去，比手动去五六个网站快得多。

价值在哪：

空投的特点是「不 claim 就过期」。Agent 帮你盯着这些机会，你只需要花 2 分钟集中签名，而不是花 2 小时在各种 DApp 之间来回跳。

5. DAO 投票和链上身份签名——你的链上人格

问题： 参与 DAO 治理需要签名投票，Snapshot 提案、链上身份验证、ENS 设置，都需要你的钱包签名。但这些事情频率不高，每次都要专门操作一次。

Agent 怎么做：

Agent 监控你关注的 DAO 提案（比如 Uniswap、Aave 的治理论坛），有新提案时给你推送摘要。你回复一句「投赞成」，Agent 就构造 EIP-712 签名请求。

EIP-712 是以太坊的结构化消息签名标准，比交易签名简单，但同样需要设备物理确认。OneKey Classic 1S 会在屏幕上显示你要签名的内容，你确认后签名结果提交到 Snapshot。

价值在哪：

两个维度的价值。一是效率——你不用打开 Snapshot 网站、连接钱包、找到提案、点投票。整个流程缩短到「看摘要 → 说一句话 → 按一下键」。

二是参与度——很多人有治理代币但从不投票，就是因为太麻烦了。降低门槛后，你的链上治理参与度会显著提升。

6. 宏观分析联动——从信号到操作

问题： 你的 AI 助手可能已经在帮你做宏观经济分析了——美联储利率决议、CPI 数据、链上资金流向。但分析归分析，分析完了呢？手动去操作？

Agent 怎么做：

这是最有想象力的场景。假设你的 AI 系统有一个宏观分析模块，它判断：「美联储释放鸽派信号，BTC 可能在未来一周上涨，建议加仓 0.1 BTC。」

在没有硬件钱包接入之前，这个建议就是一段文字。你看完可能就忘了，或者觉得「下次再说」。

有了硬件钱包接入，这个建议可以直接变成一笔待签名交易。Agent 构造好交易，附上分析逻辑：「基于以下数据点建议此操作：xxx、xxx、xxx。交易详情：在 Uniswap 上用 xxxx USDC 买入 0.1 BTC。」

你看完分析，同意逻辑，按确认键。从信号到执行，中间没有任何摩擦。

价值在哪：

这是 AI Agent 真正的杀手级应用——把认知转化为行动。很多人亏钱不是因为分析错了，是因为分析对了但没执行。Agent + 硬件钱包解决的就是这个 last mile 问题。

当然，这也是风险最高的场景。策略引擎的准确度直接决定了你的资产安全。所以物理确认在这里就更重要了——它是你最后的理性检查点。

💡 这个场景是终极形态，需要前面所有能力作为基础，而且策略引擎本身就是一个巨大的工程。但方向是对的。

7. 交易预构造 + 队列管理——攒着一起签

问题： 并不是每笔交易都需要立刻签名。有些操作可以攒一攒，集中处理。

Agent 怎么做：

所有需要签名的操作（DCA、空投 claim、投票、转账）都先进入一个待签名队列。Agent 白天慢慢积累，到了你设定的时间（比如晚上 8 点），给你推一个汇总：

「今日待签名交易 4 笔：

DCA 买入 0.05 ETH（$xxx）

Claim ARB 空投 500 枚

Aave 治理提案 #127 投赞成

向 xx 地址转账 0.1 ETH」

你花 3 分钟逐笔确认，一天的链上操作就搞定了。

价值在哪：

把碎片化的链上操作聚合成一个集中处理的环节。这不只是效率提升，更重要的是降低了操作出错的概率——集中处理时你的注意力更集中，不容易因为赶时间而忽略交易详情。

物理确认的哲学：「不方便」才是最大的安全优势

聊完场景，必须专门说说这个。

很多人第一反应是：每笔交易都要按键确认，好麻烦啊。为什么不能让 Agent 直接自动签名？

因为自动签名 = 没有签名。

想想看：如果你的 Agent 能自动签名，那意味着什么？意味着签名的私钥在软件层可访问。意味着任何能控制你服务器的人/程序都能签名。意味着一个 prompt injection、一个 0day 漏洞、一个供应链攻击，就能清空你的资产。

物理确认按键的存在，在攻击链上插入了一个不可绕过的物理间隙。这个间隙的安全性不依赖于任何软件、任何代码、任何加密算法——它依赖的是物理定律：远程攻击者没有手指。

这就是为什么我说「不方便」是 feature：

大额转账——你真的希望这是全自动的吗？

Agent 出 bug——构造了一笔错误的交易，物理确认环节就能拦住

系统被攻破——攻击者能做的最多是把恶意交易放进队列，但签不了名

Prompt injection——有人通过恶意输入控制了你的 Agent，让它构造恶意交易，但设备屏幕会显示真实的交易目标地址和金额

设备屏幕上显示的信息是最终真相。 这一点怎么强调都不为过。不管 Agent 告诉你这笔交易是什么、Discord 消息里写了什么——以设备屏幕为准。

对于个人资产管理的场景，你不需要毫秒级的交易速度，你需要的是每一笔操作都经过你的大脑。物理按键就是强制你过脑子的机制。

未来拓展：这条路能走多远？

上面说的七个场景是现在就能做的。往远了看，AI Agent + 硬件钱包的组合还有更大的空间。

DeFi 自动化管理

Lending 协议的健康因子管理——Agent 监控你在 Aave/Compound 上的借贷仓位，健康因子低于阈值时自动构造还款或追加抵押交易。清算保护这件事，靠人盯是不现实的，但全自动签名又太危险。Agent 构造 + 物理确认是最佳平衡点。

LP 仓位管理也是一样。Uniswap V3 的集中流动性需要频繁调整价格区间，Agent 可以根据市场波动自动建议调仓，你确认后执行。

跨链桥操作

跨链资产转移是出了名的操作复杂、容易出错。Agent 可以帮你选择最优桥（综合费用、速度、安全性），构造交易，你只需要确认。甚至可以做多步跨链：ETH 主网 → Arbitrum → Solana，Agent 帮你编排好每一步。

NFT 资产管理

NFT 的特殊之处在于它不可分割、价值判断主观。但 Agent 可以做的事情很多：监控地板价变化、发现可疑的挂单（比如你的 NFT 被以远低于地板价挂出——可能是钓鱼签名导致的）、批量 list/delist、royalty 收入追踪。

社交恢复和多签

更长远的方向是把硬件钱包与社交恢复方案结合。Agent 管理多签钱包的日常操作，在需要恢复时协调多个签名者。这在 DAO 财库管理场景下尤其有价值。

链上身份聚合

随着 DID（去中心化身份）和 Attestation 协议的发展，你的链上身份会越来越丰富。Agent 帮你管理这些身份凭证——哪些该续期了、哪些该撤销了、新的 attestation 要不要签名接受。

技术上怎么落地？

简单说一下技术实现路径，给想动手的人一个方向。

OneKey 提供了官方 SDK：@onekeyfe/hd-common-connect-sdk，支持 Node.js 环境。通过 USB HID 协议跟设备通信，核心 API 就几个——getPublicKey（导出公钥，无需确认）、signTransaction（签名交易，需确认）、signMessage（签名消息，需确认）。

整体架构分三层：

Driver 层：封装 USB 通信，处理设备连接/断开/状态检查。这一层尽量薄，只管通信，不管业务。

Wallet 层：钱包业务逻辑，地址管理、余额查询、交易构造。余额查询不需要设备在线——用缓存的 xpub 派生地址，直接查 RPC 节点。只有签名操作才需要设备。

Agent 层：你的 AI 助手调用 Wallet 层的接口。只读操作（查余额、查地址）全自动执行。写操作（签名）进入队列，等你物理确认。

💡 一个关键设计：大多数操作不需要设备在线。 首次连接时导出 xpub 并缓存，之后查余额、构造交易都是纯软件操作。只有最后签名那一步需要设备。这意味着即使设备没插着，Agent 的大部分功能照常运行。

实施建议是渐进式的：先搞定只读能力（资产仪表盘 + 异常监控），再搞交易能力（签名 + 广播），最后才是高级场景（DCA、空投等）。每一步都可以独立验证和使用。

一个更大的图景

把视角拉远一点。

AI Agent + 硬件钱包，本质上是在解决一个更根本的问题：如何让 AI 安全地代理人的链上行为？

纯 AI 自动化 = 快但不安全。纯人工操作 = 安全但效率低。硬件钱包提供的物理确认机制，恰好在这两者之间找到了一个甜蜜点。

Agent 负责信息处理和决策辅助——它比你看得多、算得快、不会犯低级错误。

硬件钱包负责执行层面的安全兜底——它不聪明，但它忠诚。

你负责最终决策——按下那个按钮，意味着你为这个操作负责。

这个三角关系里，每个角色都在做自己最擅长的事。

我不认为未来会有人愿意把链上资产的完全控制权交给 AI。但我确信，「AI 帮你看、帮你想、帮你准备，你来按最后那个键」这个模式，会成为链上资产管理的标准范式。

那个小小的物理按键，就是人和 AI 之间的信任边界。