字节跳动将参与语言生成大模型研发,原阿里m6带头人杨红霞被曝加盟aila-pg电子官方网站试玩网
当前位置: 苏州资讯网 >热点 >

字节跳动将参与语言生成大模型研发,原阿里m6带头人杨红霞被曝加盟aila-pg电子官方网站试玩网

时间:2023-03-22 18:09   阅读量:6316   

,阿里 m6 大模型的原带头人杨红霞已于去年 9 月因个人家庭原因从阿里巴巴达摩院智能计算实验室离职。36 氪从多处独立信源获悉,杨红霞现已加入字节 ai lab,参与语言生成大模型的研发。

有知情人士称,杨红霞在语言生成大模型团队中处于领导地位,直接向字节跳动副总裁杨震原汇报。

据公开资料,杨红霞 2007 年本科毕业于南开大学,后前往美国杜克大学统计科学系攻读博士学位,师从 david dunson 教授。博士毕业后,杨红霞先入职 ibm 全球研发中心任 watson 研究员,之后入职雅虎公司,担任首席数据科学家。

据it之家所知,她在人工智能领域国际会议、顶级期刊有上百篇顶级论文。2022 年 6 月,杨红霞入选 2022 福布斯中国科技女性 50 榜。

2016 年,杨红霞结束了她在美国近 10 年的留学及工作生涯回国,去往杭州加入阿里巴巴集团。而阿里大模型 m6 正是杨红霞在任期间的最突出成就,在她离职之前一直是阿里达摩院超大规模多模态预训练模型 m6 的技术负责人。

杨红霞领导的阿里巴巴达摩院 m6 团队致力于认知智能方向,此前已经研发出了 aligraph、m6、洛犀等较为有影响力的人工智能开源平台和系统,在美国和中国注册的专利超过 30 项。

m6 是一项通用性 ai 大模型,拥有多模态、多任务能力,尤其擅长设计、写作、问答,在电商、制造业、文学艺术、科学研究等领域都具有广泛应用前景。

m6 于 2021 年 3 月首次发布,是国内首个千亿参数多模态大模型,后续又通过 480 块 gpu更迭至万亿参数,再在512 gpu 的基础上成功在 10 天内训练出 10 万亿模型,与 gpt-3 具有同等参数规模,但能耗仅为其 1%。

值得一提的是,openai 前政策主管 jack clark 当时曾赞扬道:这个模型的规模和设计都非常惊人。这看起来像是众多中国的 ai 研究组织逐渐发展壮大的一种表现。

值得一提的是,阿里巴巴技术副总裁贾扬清昨日也宣布从阿里巴巴毕业,表示将走向职业生涯的下一个挑战。据称,其计划创业的方向属于是 ai 基础设施提供商,关注包括大模型在内的 ai 应用。

据公开资料,贾扬清为浙江绍兴人,本科和研究生阶段就读于清华大学自动化专业,后赴加州大学伯克利分校攻读计算机科学博士。他在博士期间创立并开源了如今业内耳熟能详的深度学习框架 caffe,被微软、雅虎、英伟达、adobe 等公司采用。

来源: it之家 编辑: 沐瑶

郑重声明:此文内容为本网站转载企业宣传资讯,目的在于传播更多信息,与本站立场无关。仅供读者参考,并请自行核实相关内容。

  • 苏州
  • 江苏
  • 财经
  • 资讯
  • 旅游
  • 文化
周庄 今晚亮灯“灯”你,共度佳节
周庄 今晚亮灯“灯”你,共度佳节
第十四届全国运动会开幕 目前已决出多枚金牌
第十四届全国运动会开幕 目前已决
亿联银行同业交流会开幕,全国各地近66家金融机构125名代表出席会议
亿联银行同业交流会开幕,全国各地
【传承民族经典 弘扬中华武术】苏州市青少年武术锦标赛开赛
【传承民族经典 弘扬中华武术】苏
“鹭岛”为家:苍鹭的东北安家之旅
“鹭岛”为家:苍鹭的东北安家之旅
国家大剧院周末音乐会迎来600场
国家大剧院周末音乐会迎来600场
网站地图