将商汤股价大涨归因于日日新大模型的发布。 商汤科技也公告称,除了日日新的推出外,董事会不知悉有关价格及交易量变动的任何原因。 在此前的月日,商汤正式推出日日新大模型,自年月首次问世至今,商汤日日新SenseNva大模型体系已推出五个大版本迭代,最新的版本采用混合专家架构(ME),超TBtkens训练,覆盖大量合成数据,推理时上下文窗口达K左右。 商汤科技董事长兼CEO徐立表示,本次更新主要增强了知识、数学、推理及代码能力,全面对标GPT-Trb,主流客观评测上达到或超越GPT-Trb。
实际上,自百模大战后,端侧大模型一直是AI巨头的兵家必争之地。 所谓端侧大模型,是指运行在设备端的大模型,通常比通用大模型参数量要小,因此可以使用端侧算力直接运行。 对网络条件的要求也更低,隐私不必离开设备且无需云端算力,端侧AI都可以生成回答,因此拥有更低的成本。
沉寂良久的AI企业商汤近日迎来爆发。 月日,商汤高开%,开盘后公司股价迅速拉升,盘中涨超%,之后时分起公司股票暂停买卖。 暂停交易前,商汤股价涨幅%,股价报港元/股,成交量远高于前几日。 当日晚间,商汤在港交所发布公告称,已向港交所申请月日上午时起恢复买卖。
月日延续了此前的好光景,商汤复牌后续涨%。
因为成本更低,端侧模型有望对消费产业带来积极影响,包括汽车、手机、XR等设备,让更多平价的电子设备接入大模型的智能体验,无需考量算力成本。 (责任编辑:康嘉林)。
在基准测试中,该端侧模型全面超越了MiniCPM-B、Phi-等同量级的大模型,并且还越级比肩一些B、B大模型。
在日日新大模型体系中,商量端侧模型SenseChat-Lite成为了此次发布的最大亮点。