分享好友 发表回复 发表帖子 家装圈首页 家装圈列表 频道列表

DeepMind 发布全新模型设计工具 Tracr:从可解释逻辑反向搭建模型

楼主 jc68jy048
DeepMind 发布全新模型设计工具 Tracr:从可解释逻辑反向搭建模型
 
「可解释性」一直是深度学习难以绕过的难题,用户无法理解模型的运行机制,也就无法放心地把模型应用到实际场景中。
 
最近来自苏黎世联邦理工学院和 DeepMind 的研究人员提出了一种全新的模型构造工具 Tracr,直接由人来根据「已知的机制」针对不同任务编写代码,然后由 Tracr 编译成模型的权重,让模型的解释变得更轻松。
 
Tracr 的输入为采用领域特定语言 RASP 编写的代码,输出为标准的、仅包含解码器的、类似 GPT 的 Transformer 结构的权重。
 
在实验部分,研究人员使用 Tracr 创建了一系列 ground truth Transformers,实现了包括计算 token 频率、排序和 Dyck-n 括号检查等程序。
【温馨提示】本文内容和图片为发布者所有,本站只提供信息存储空间服务,如有涉嫌抄袭/侵权/违规内容请联系QQ:727533600 删除!
反对 0
举报 0
收藏 0
打赏 0
评论
输入关键词搜索更多
更多城市地区全国城市联盟