• 4 月 24 日晚,沐曦股份宣布携手 FlagOS 已完成对 DeepSeek 最新开源的 DeepSeek\-V4\-Flash 模型的 Day 0 适配 ... 沐曦股份还联合上海人工智能实验室 KernelSwift 智能算子迁移系统,率先完成 DeepSeek\-V4 核心算子的 Day 0 适配 ... 截至目前,沐曦股份已完成针对国内 19 款主流开源模型的极速适配,全面覆盖 DeepSeek、MiniMax、智谱、阿里巴巴、腾讯、阶跃星辰、百度等头部厂商最新旗舰模型,种类涵盖语言、多模态、OCR、3D 生成等全领域,效率领跑行业。
    华尔街见闻 / 万小婷
    14 分钟前
  • 谈及「Momenta 如何运用海量的用户数据」,曹旭东分享道:「我们可能会分为预训练的阶段和 Post\-Training 的阶段」... 海量量产的数据包括了大量的长尾数据,通过 World Model Pre\-Training 来预训练这个模型 ... 他继续道:「预训练完,这个模型会有物理常识,但有物理常识不代表它是一个好司机,因为大量的数据里面有好的驾驶行为,但更多是不好的驾驶行为,所以还是需要 Post\-Training,把它的行为激发或对齐到人类好的行为上」。
    新浪科技 / 新浪科技
    19 分钟前
  • 中国科学技术大学今天在安徽合肥发布「灵境造物」智能科研工具,面向全球科研主体开放,** 标志着「人工智能驱动的科学研究」正走向工程化、平台化和开放共享 ** ... 该系统依托千余台多模态科研机器人和万余台智能科学工作站,深度整合 1214 个科研技能,可实现自主科研、自主创制物质、自主发现新知识,有效破解传统科研中成本高、周期长、转化难等痛点 ... 该系统已面向全球所有科研人员、机构和相关企业开放服务,让不同国家、不同规模的创新主体都能享受智能科研带来的便利。
    IT 之家
    22 分钟前
  • 页面宣布旗下新发布的旗舰级大模型 DeepSeek\-V4\-Pro 开启限时 2\.5 折优惠活动 ... 此次调价后,DeepSeek\-V4\-Pro 的输入价格(缓存命中)低至每百万 tokens 0\.25 元,输入价格(缓存未命中)为 3 元,输出价格为 6 元 ... DeepSeek\-V4\-Pro 模型采用了业界领先的混合专家(MoE)架构,其总参数量达到 1\.6 万亿,单次激活参数约为 490 亿。
    IT 之家
    25 分钟前
  • DeepSeek 之前的特色就是通过极致的算法和结构优化降低 AI 大模型的成本,API 定价超级有性价比,这次的 DeepSeek V4 中的 Flash 定价也是如此,但 V4 Pro 因为是 1\.6 万亿参数量,价格涨了几倍 ... 百万 Token 输出是 24 元,百万 Token 输出中未命中缓存是 12 元,缓存命中则是 1 元,比 Kimi 2\.6 或者 GLM\-5\.1 等国产大模型也是不相上下,甚至部分价格还更高一些,反正没有之前的超级性价比了 ... 昨天的发布新闻中,DeepSeek 提到下半年随着昇腾 950 平台的批量上线,DeepSeek V4 的价格还会大幅下降,这次的优惠幅度就可以看作一次预演,如果下半年算力不是问题之后,能保持现在 2\.5 折的价格,那 DeepSeek V4 真的又变成了人类之光了。
    快科技 / 宪瑞
    29 分钟前
  • 这一轮存储芯片价格暴涨的直接推动力是 AI 需求,然而谷歌前不久公布的一项 AI 算法可将内存使用量减少 6 倍,一度引发了内存公司股价暴跌 ... 这个技术名为 TurboQuant,是一种新型压缩算法,解决了之前 FP4 以下精度大幅损失的缺陷,** 在 H100 显卡上可以降低 6 倍的内存使用,并提升了 8 倍的 AI 性能,** 可以显著降低 AI 对内存的需求量 ... SK 海力士对这个算法的影响力并不认可,在财报会议上否认了该技术可能削弱内存需求的说法,表示这种内存优化技术反而会成为推动内存需求的催化剂,它扩展了内存生态系统。
    快科技 / 宪瑞
    44 分钟前
  • 鉴于此,亟须构建面向人工智能就绪度和应用绩效的双维评价认证体系,推进标注体系的智能化与平台化建设,完善数据权益保障与流通基础设施建设,以真实业务需求驱动高质量数据集建设,切实提升数据要素赋能人工智能创新发展的系统性与可持续性 ... 2023 年 12 月,国家数据局等部门发布的《「数据要素 ×」三年行动计划(2024—2026 年)》提出,「完善数据资源体系,在科研、文化、交通运输等领域,推动科研机构、龙头企业等开展行业共性数据资源库建设,打造高质量人工智能大模型训练数据集」,直接将数据集建设与人工智能发展需求相挂钩 ... 在数据要素赋能人工智能创新发展方面,数据数量和数据质量都至关重要。
    智源社区
    52 分钟前
  • 2026 年 4 月,万亿开源模型 Kimi K2\.6 和 DeepSeek V4 同周上线 ... 但同一周两个万亿参数开源模型同时落地,背后的技术还在互相渗透,被 GTC 和 Meta 选为性能基准,被 Cursor 和 Rakuten 拿去当底座 ... Https://huggingface.co/deepseek\-ai/DeepSeek\-V4\-Pro/blob/main/DeepSeek\_V4\.pdf https://openrouter.ai/rankings。
    智源社区
    52 分钟前
  • 为进一步发挥人工智能作为全球公共产品对可持续发展目标(SDGs)的支撑作用,推动包容、普惠、公平的全球科技治理,中国科学学与科技政策研究会联合多家国际组织与学术机构,共同举办第 11 届联合国科技创新促进可持续发展目标多利益攸关方论坛(STI Forum)边会 ... 近期召开的未来峰会及通过的《全球数字契约》重申了国际社会利用数字技术造福人类的承诺,明确呼吁人工智能以包容、透明、可问责的方式为人类服务 ... 本次边会将围绕包容性、普惠性与公平性三个核心维度,通过跨国别、跨部门的交流,探索加强全球伙伴关系、降低能源与资本门槛、确保人工智能驱动的发展不让任何人掉队的切实路径。
    智源社区
    52 分钟前
  • 2. ** 产品维度 **|关注核心产品的创新性、市场适配性和用户体验,包含产品创新性、产品用户规模、用户体验等角度 ... 3. ** 产品表现力 **|关注产品的用户反馈和市场表现,包括产品用户规模和留存率、用户反馈、产品影响力等角度 ... 4. ** 产品潜力 **|关注产品在未来发展和市场扩展方面的潜力,包括产品生态、产品市场潜力、产品战略规划等角度。
    智源社区
    52 分钟前
  • loading
科技新闻,每天 3 分钟