AI
未读
kimi-k2.5 为何能屠榜(国货之光)
一、大模型训练过程回顾 1、文本大模型训练 数据语料先通过 BPE 算法分词得到文本 Token(1 个 token ≈ 1.2–1.5 个汉字),再通过 词汇表(Vocab) 映射为数字 ID,数字 ID 经过 Embedding 层转换成向量,最后输入 Transformer 模型进行训练。 2
AI
未读
AI 相关技术及工具的应用认知
glmos-code-explain 一、模型介绍 1.1 模型分类 模型应用 按输入数据类型:语言模型、视觉模型、语音模型、多模态模型 按核心能力:语言模型、推理模型(OpenAI o1、o3,Anthropic Claude 3.7 Sonnet、Baichuan-M1-preview、Deep
AI
未读
程序员入门 AIGC
本文思想: AI、AIGC、GPT...几个专业名词是什么?有什么联系? AI 浪潮从22年底开始变得火热,全民 AI 的时代已经到来,为何? 程序员如何学习大模型,需要掌握什么 ? 扫盲+使用入门为主,不知道自己不知道什么?不知道怎么用? 一、名词概念 1.1 名词解释