DeepSeek 开源新模型 V3.1:上下文长度拓展至 128K
8月20日消息,DeepSeek日前在Hugging Face上开源了新模型 V3.1-Base。 此外,日前DeepSeek 还发布通知称,线上模型版本已升...
8月20日消息,DeepSeek日前在Hugging Face上开源了新模型 V3.1-Base。 此外,日前DeepSeek 还发布通知称,线上模型版本已升...
国产大模型公司深度求索(DeepSeek)发布详细的升级公告,解释DeepSeek-R1升级的具体情况。 5月29日,据DeepSeek公告,DeepSeek...
凤凰网科技讯 (作者/陈俊熹)2月21日,朱啸虎发朋友圈,对LLM(大语言模型)进行了“终局猜想”。他认为,LLM市场的核心将是DeepSeek,类似Linux...
1月15日,科大讯飞发布了当前全国产算力平台上唯一的深度推理大模型——讯飞星火X1。该模型中文数学能力国内第一,并率先应用于教育、医疗等刚需场景。 同时,讯飞星...
出品 | 搜狐科技 作者 | 梁昌均 “你们来到拉斯维加斯激动吗?喜欢我的夹克吗?”在“科技春晚”CES 2025开幕首日,英伟达创始人&CEO黄仁勋...
投资者从银行购入的黄金 付乐/摄影 本报(chinatimes.net.cn)记者付乐 北京报道 “外围大跌,今早修复力度很弱,但愿不是亏钱的一天。”11月1...