加密货币 - 相关文章

从DeepSeek爆火看知识蒸馏：如何让小模型拥有大模型的智慧？

📅 2025-02-24 👁 209 次阅读 📂 AI应用

一、从DeepSeek出圈说起最近国产大模型DeepSeek（深度求索）突然爆火，开源模型在多项评测中超越O1的表现令人惊叹。但更值得关注的是，其实很多我们熟知的大模型这都是知识蒸馏技术的杰作哦，然后我就好奇到底怎么实现的模型蒸馏，上网查阅之后发现没有比较好的代码教学，那么这里我就写一个简单的快速...

啥是DeepSeek的蒸馏算法？早在康乾年间，国人就会了！

📅 2025-02-24 👁 165 次阅读 📂 AI应用

点击上方蓝字关注“尹哥聊基因” 最近微信改版，容易找不到尹哥的文章，大家记得把尹哥设为星标⭐️ 哦~ DeepSeek过年期间已经讲了7期，感觉把要想讲的要点都说完了。但还经常收到后台留言，问他为啥能成功，开源以及极致的性价比，尤其是用了蒸馏算法，将原来要上亿美金的大模型训练成本降低到了仅仅数百万...

大白话说清楚DeepSeek的蒸馏技术到底是什么？

📅 2025-02-24 👁 179 次阅读 📂 AI应用

各位小伙伴们大家好哈。 DeepSeek R1火了之后，模型蒸馏这个词儿也跟着火了。一方面， OpenAI暗戳戳的（其实已经算明指了）表示DeepSeek就是用GPT的数据来做的蒸馏（别人说你起诉啊，OpenAI又说不）；另一方面，的确真有很多知名的公司利用R1版模型蒸馏出更多小模型，有基于L...

DeepSeek的“蒸馏模型”超越原创？美国要对“蒸馏技术”下手

📅 2025-02-24 👁 151 次阅读 📂 AI应用

中国人工智能初创公司DeepSeek在过去一周成为硅谷热议的对象，并触发了本周一美国科技股“崩盘”。 1月29日，OpenAI最新称，它发现有证据表明中国人工智能初创公司DeepSeek使用其专有模型来训练自己的开源模型，并暗示这可能违反了OpenAI的服务条款。但OpenAI没有进一步列举哪些证据...

DeepSeek：技术洞察与解析（深度好文）

📅 2025-02-23 👁 162 次阅读 📂 AI应用

目录 DeepSeek，全称杭州深度求索人工智能基础技术研究有限公司。DeepSeek 是一家创新型科技公司，成立于2023年7月17日，使用数据蒸馏技术，得到更为精炼、有用的数据。由知名私募巨头幻方量化孕育而生，专注于开发先进的大语言模型（LLM）和相关技术，目标是实现通用人工智能...

DeepSeek强化学习（Reinforcement Learning）基础与实践

📅 2025-02-23 👁 192 次阅读 📂 AI应用

DeepSeek强化学习（Reinforcement Learning）基础与实践最新推荐文章于 2025-02-21 01:26:07 发布 Evaporator Core 最新推荐文章于 2025-02-21 01:26:07 发布阅读量140 收藏点赞数 4 分类专栏：强化学习 ...

DeepSeek R1 详解：思路链、强化学习和模型提炼

📅 2025-02-23 👁 156 次阅读 📂 AI应用

DeepSeek 代表着一次重大飞跃。大多数新的人工智能模型感觉都像是小步前进。DeepSeek R1则不同。这是近来第一个让你停下来思考的模型，这可能很重要。上周日，中国的一个团队发布了该模型，并已引起轰动。其基准在推理任务（数学、编码和科学）方面接近 OpenAI 的 01 模型。但有趣的不...

【通俗解释,入门级】DeepSeek

📅 2025-02-23 👁 174 次阅读 📂 AI应用

DeepSeek - R1 - Zero：强化学习提升LLM推理能力的奥秘第一节：强化学习在DeepSeek - R1 - Zero中的基本概念与公式解释【通俗解释】强化学习在DeepSeek - R1 - Zero里就像是一位“聪明的探险家”，在各种可能的推理路径中探索，通过不断尝试，找到最正...

DeepSeek惊艳AI界：强化学习如何推动智能革命

📅 2025-02-23 👁 182 次阅读 📂 AI应用

广泛的应用场景强化学习的应用已经遍及众多行业，并展示出强大的能力：游戏AI ：从AlphaGo的棋盘上颠覆传统到DeepMind的StarCraft代理，强化学习在游戏领域创造了一个又一个奇迹。机器人控制：无论是在自动化生产线、无人机导航还是机械臂操作中，强化学习都使机器人能够自主地完成更为...

强化学习新时代：DeepSeek R1如何颠覆AI推理模型的训练方式？

📅 2025-02-23 👁 173 次阅读 📂 AI应用

近年来，人工智能（AI）领域持续引发广泛关注，而DeepSeek R1作为最新的国产大语言推理模型，正如一颗重磅炸弹震惊了全球。该模型由杭州幻方量化公司开发，以其出色的表现、低训练成本和低运营成本，引发了业界的极大兴趣。本文将深入剖析DeepSeek R1的训练方法，探索其背后的科学原理以及对未来A...

最新文章