OpenAI 正式发布 GPT-5.2,为专业知识型工作而打造

OpenAI正式推出GPT-5.2系列模型,涵盖Instant、Thinking与Pro三个版本,显著提升在电子表格制作、代码生成、长文本理解、多步推理及视觉分析等专业任务中的表现。

  • Instant:强调低延迟与高响应,适配信息查询、文档翻译、基础写作等常规任务
  • Thinking:聚焦编程、长文档分析、数学推理与项目规划,定位企业级复杂场景的智能助手
  • Pro:面向科研、金融与高难度任务,强调极致准确性与可靠性,被称为“能力天花板”

GPT-5.2 Thinking在GDPval评测中以70.9%的胜率超越行业专家,幻觉率降低38%,并支持高达256k Token的长上下文处理。

智谱最新的模型

GLM-Z1-AirX(极速版):定位国内最快推理模型,推理速度可达 200 tokens / 秒,比常规快 8 倍;

GLM-Z1-Air(高性价比版):价格仅为 DeepSeek-R1 的 1/30,适合高频调用场景;

GLM-Z1-Flash(免费版):支持免费使用,旨在进一步降低模型使用门槛。

Llama3.1版本

Llama 3.1 的新功能和集成

  • Llama 3.1 三种规格: 8B、70B 和 405B,适用于不同规模的应用。
  • 引入六个新开源的大型语言模型(LLM)。
  • 支持128K token的上下文长度和8种语言。
  • 在定制GPU集群上训练,总训练量达到15万亿token,总计39.3M GPU小时。
  • 允许使用模型输出来改进其他LLM,包括合成数据生成和蒸馏。

Llama 3.1 的发布及其规格介绍

  • 发布并进入 Hugging Face 平台,与 Meta 合作实现优化集成。
  • 三种规格:8B、70B 和 405B,分别适用于不同规模的应用和场景。
  • 引入了多项新功能,包括指令模型的微调和工具调用支持。

Llama 3.1 的特性、性能及使用分析

  • 包括六个开源LLM模型分为三种规格:8B、70B 和 405B。
  • 两个新模型:Llama Guard 3 和 Prompt Guard,用于保护模型和检测提示注入和越狱。

Llama 3.1 的许可证变动

  • 许可证允许使用模型输出来改进其他LLM,包括合成数据生成和蒸馏。
  • 用户可以使用Llama 3.1 模型生成的数据集来微调更小、更专业的模型。

Llama 3.1 的硬件需求

  • 三种规格在训练和推理中的内存需求各不相同。
  • 运行Llama 3.1 需要考虑硬件资源,特别是内存。