娱乐城开户-富邦娱乐城金杯娱乐城

新聞中心

當(dāng)前您的位置: 首頁> 新聞中心> 學(xué)術(shù)講座> 正文

講準(zhǔn)字【2025】第115號(hào):MoBA:用于長(zhǎng)上下文LLM的塊注意力混合機(jī)制

發(fā)布時(shí)間:2025-05-23 瀏覽量:

講座報(bào)告主題:MoBA:用于長(zhǎng)上下文LLM的塊注意力混合機(jī)制
專家姓名:裘捷中
日期:2025-05-24 時(shí)間:14:45
地點(diǎn):會(huì)議中心第一報(bào)告廳
主辦單位:計(jì)算機(jī)科學(xué)與通信工程學(xué)院


主講簡(jiǎn)介:裘捷中,中科院杭州醫(yī)學(xué)所研究員。本科和博士畢業(yè)于清華大學(xué)計(jì)算機(jī)系,導(dǎo)師為唐杰教授,Google Scholar引用7000多次,曾獲得2024年國(guó)際基礎(chǔ)科學(xué)大會(huì)(ICBS)前沿科學(xué)獎(jiǎng)、2023年CCF博士學(xué)位論文激勵(lì)計(jì)劃提名、2023年北京市優(yōu)秀博士學(xué)位論文提名、2022年SIGKDD 博士論文獎(jiǎng)亞軍。研究專長(zhǎng):研究領(lǐng)域?yàn)?AI4Science,大規(guī)模預(yù)訓(xùn)練和圖學(xué)習(xí)。


主講內(nèi)容簡(jiǎn)介:報(bào)告介紹了混合塊注意力(Mixture of Block Attention,簡(jiǎn)稱MoBA),這是一種將混合專家(Mixture of Experts,簡(jiǎn)稱MoE)技術(shù)應(yīng)用于注意力的新型稀疏注意力架構(gòu)。這種架構(gòu)允許每個(gè)query在訓(xùn)練時(shí)動(dòng)態(tài)地學(xué)習(xí)需要關(guān)注的KV塊,而不是引入提前設(shè)定的稀疏注意力規(guī)則。MoBA在長(zhǎng)文本任務(wù)中表現(xiàn)出色,并且能夠在全注意力和稀疏注意力之間無縫切換,提升效率的同時(shí)不會(huì)降低性能。MoBA已經(jīng)部署用于支持Kimi的長(zhǎng)文本服務(wù)。


歡迎師生參加!

專家姓名 裘捷中 講座時(shí)間 2025-05-24 14:45
講座地點(diǎn) 會(huì)議中心第一報(bào)告廳
百家乐桌子租| 百家乐游戏辅助| 真人百家乐官网蓝盾赌场娱乐网规则 | 百家乐官网事一箩筐的微博| 大发888游戏好吗| 运城百家乐官网蓝盾| 大发888娱乐城注册lm0| 澳门百家乐官网网上赌博| 威尼斯人娱乐中心老品牌| 新百家乐官网的玩法技巧和规则 | 百家乐官网板路| 太阳城网上| 游艇会百家乐官网的玩法技巧和规则 | 百家乐官网全部规| 新全讯网22335555| 诺贝尔百家乐官网的玩法技巧和规则| 大发888官方下载 银行| 请问下百家乐官网去哪个娱乐城玩最好呢 | 汤阴县| 传奇百家乐的玩法技巧和规则| 百家乐官网拍照看| 揭东县| 澳门百家乐论坛及玩法| 免费百家乐官网预测工具| 网上百家乐官网网址| 喜力百家乐官网的玩法技巧和规则| 千亿娱乐网| 百家乐赌博规| 云鼎百家乐官网代理| 战神线上娱乐| 百家乐任你博赌场娱乐网规则| 网上百家乐官网是不是真的| 百家乐官网玩法注意事项| 百利宫娱乐城信誉| 百家乐孖宝揽| 太阳城百家乐外挂| 爱婴百家乐官网的玩法技巧和规则| 实战百家乐官网博彩正网| 新运博娱乐| 大发888赌博网站| 太阳城百家乐祖玛|