内容简介:无辅助损失的负载均衡策略 是一种用于解决深度学习中专家混合系统(MoE)负载不均衡问题的方法 ,它不依赖额外的辅助损失函数来实现负载均衡,而是通过直接调整专家接收输入的概率来平衡各个专家的负载,以下是具体介绍及举例: 策略原理 动态调整接收概率 :系统会根据每个专家的历史利用率情况,动态地调整其接收新任务的概率。对于那些利用率过高的专家,降低其接收新任务的概率...
用户评论
推荐服务