
7月7日下午,天壤创始人、CEO薛贵荣接受了《每日经济新闻》记者的专访
每日经济新闻 2023-07-10 19:19:05
(资料图片)
7月7日下午,天壤创始人、CEO薛贵荣接受了《每日经济新闻》记者的专访。在2023世界人工智能大会上,该公司发布了一种大模型产品生态——“天壤小白”。其中包含最高1860亿参数的通用大语言模型、语义搜索引擎和开发平台。
目前,国内已是“百模混战”,天壤推出的大模型生态有何别致之处呢?薛贵荣首先向记者介绍了大模型存在的四大挑战,即大模型产生真假难辨的“幻觉”,所谓“一本正经的胡说八道”;政企私有数据的保密性要求,不能对外公开;缺少可靠的企业级中文大模型;大模型存在封闭性,无法自动更新信息。
关于天壤如何解决大模型“一本正经的胡说八道”,薛贵荣表示:“用‘提示词’去控制大模型,大模型还是会胡说八道。后来,有人尝试输入一些简单的上下文,以及对大模型进行fine-tune,但这个也不够。我们为了解决‘幻觉’问题,做了一个语义搜索引擎。先把需要的所有文档,放到语义引擎里面,比如法律书、知识库或者企业内部各种数据。该引擎使用了一个核心技术,即embedding。”
薛贵荣进一步解释:“生成式模型,最大的特点就是结果的不确定性。”那么,如何提高生成式模型的准确性呢?
薛贵荣认为:“现在给你100个字,你的答案就在这100个字里面总结。”那么是否为了提高准确性,限定生成(内容)的范围?薛贵荣回答称:“你只能用这里面的内容,做一次理解上的修饰。”
据其介绍,上述限制是放在推理端。简而言之,就是训练好大模型,为了得出一个精确值,在推理端限定一个范围。
薛贵荣介绍称,目前公司主要有三个团队,一个专门训练大模型;第二个是Fine-tune,做行业专用模型;第三个是做应用提示。
对于天壤小白大模型通过什么算力训练的?薛贵荣表示:“我们(基础)大模型的算力是租的,比如租用苏州超算(的算力),上海像商汤(的算力)我们也租。它们(商汤)有1万多张A100。另外,我们家里也有大概300张卡,以3090为主。”
7月7日下午,天壤创始人、CEO薛贵荣接受了《每日经济新闻》记者的专访
央视网消息:据@济南网警巡查执法微博消息,针对网传“济南大学每月给
潮新闻客户端记者岑天宇据浙报传媒地产研究院追踪统计,本周(7 10-7 1
近期,珠海市香洲区组织开展重大事故隐患专项排查整治2023行动,对各行
医药板块的加速回升趋势越来越显著。据Choice数据显示,截至7月6日,7
掌上生“花”!东西湖20多名小学生暑期学非遗技艺---让非遗翻花项目走
为进一步发挥家庭在廉洁文化建设中的作用,在全社会营造注重家庭、注重
截至2023年7月10日收盘,国泰集团(603977)报收于9 18元,上涨0 33%,换
在不断东扩激发俄乌冲突后,北约意犹未尽,又将目标瞄向亚太,预计将在
“幸福食堂”里老人们聊家常、享受营养健康的午餐;“移动文明礼堂”内
2022-2027年CAGR为88 6%,免热合金市场规模有望快速增长(附股)!详情
重庆:上半年累计办理启运港退税超3700万元
1、漂亮啊漂亮 漂亮漂亮天亮漂亮诸葛亮。2、是漂亮猪哥亮眼前一亮肯
死亡岛激流和死亡岛的发行时间不同,主要角色不同,背景设定不同,《死
智通财经APP获悉天风证券601162发布研究报告称首先总量板块中寻找低库