美圖發(fā)布視覺大模型Miracle Vision3.0丨華為“小藝”將支持通話語音轉(zhuǎn)文本丨視覺中國(guó)與華為研發(fā)視覺大模型
AI奇點(diǎn)網(wǎng)2023年10月10日?qǐng)?bào)道丨AI資訊早報(bào)
美圖發(fā)布自研視覺大模型3.0,全面應(yīng)用于美圖旗下的影像與設(shè)計(jì)產(chǎn)品
10月9日,美圖公司舉辦15周年生日會(huì),在活動(dòng)上,美圖自研AI視覺大模型Miracle Vision3.0版本正式發(fā)布,將全面應(yīng)用于美圖旗下影像與設(shè)計(jì)產(chǎn)品,并將助力電商、廣告、游戲、動(dòng)漫、影視五大行業(yè)“工作流提效”。
美圖創(chuàng)始人、董事長(zhǎng)兼CEO吳欣鴻將Miracle Vision的核心能力拆解為“奇思妙想”和“智能創(chuàng)作”兩大特性,其中,在“奇思妙想”層面,Miracle Vision通過“提示詞智能聯(lián)想”功能降低大眾的使用門檻,而在“智能創(chuàng)作”層面,Miracle Vision則通過“深化創(chuàng)作”功能,進(jìn)一步豐富作品細(xì)節(jié)和提升表現(xiàn)力;在應(yīng)用領(lǐng)域方面,Miracle Vision將持續(xù)在電商、廣告、游戲、動(dòng)漫、影視五大行業(yè)深耕。“吳欣鴻強(qiáng)調(diào),AI視覺大模型的出現(xiàn),不是要取代現(xiàn)有的從業(yè)者,而是幫助他們提升工作效率。”
華為對(duì)外展示“小藝助手”通話語音轉(zhuǎn)文本功能
10月8日,華為終端BG CTO李小龍?jiān)谖⒉┥蟿⊥噶巳A為鴻蒙語音助手“小藝”的通話及語音轉(zhuǎn)寫功能,并聲稱新功能很好用。他以AI幫助接聽平安車險(xiǎn)的銷售經(jīng)理的電話為例,“小藝”可以幫助用戶對(duì)付銷售電話的來訪。
有網(wǎng)友在評(píng)論區(qū)詢問,該功能是否可以模仿機(jī)主聲音,李小龍回應(yīng)稱,用戶可以自己錄制開場(chǎng)語。
視覺中國(guó)與華為云達(dá)成視覺大模型研發(fā)合作,基于盤古大模型開發(fā)
視覺中國(guó)宣布,近日,該公司與華為云正式簽署關(guān)于視覺大模型的合作協(xié)議。雙方將以華為云盤古大模型為基礎(chǔ)打造視覺大模型,共同實(shí)現(xiàn)視覺領(lǐng)域高度智能化發(fā)展,推進(jìn)更深層次的內(nèi)容產(chǎn)業(yè)智能轉(zhuǎn)型。
今年7月的華為云HDC 2023開發(fā)者大會(huì)上,視覺中國(guó)作為華為云大模型高質(zhì)量數(shù)據(jù)聯(lián)盟首倡單位參與了大會(huì),視覺中國(guó)總裁柴繼軍在大會(huì)AI圓桌論壇上介紹了視覺中國(guó)“AI+內(nèi)容+場(chǎng)景”戰(zhàn)略。
華人團(tuán)隊(duì)提出交錯(cuò)視覺語言生成模型MiniGPT-5
10月3日,加州大學(xué)圣克魯茲分校的華人AI研究團(tuán)隊(duì)提出了一種新的視覺大模型解決方案——MiniGPT-5。這是一種以”生成式Voken“概念為基礎(chǔ)的創(chuàng)新型交錯(cuò)視覺語言生成技術(shù)。
據(jù)介紹,通過特殊的視覺Token”生成式Voken“,MiniGPT-5將Stable Diffusion的擴(kuò)散模型機(jī)制,與以ChatGPT為代表的LLM(大型語言模型)相結(jié)合,為更強(qiáng)大的大模型多模態(tài)生成能力預(yù)示了一種新的模式。
除了原有的多模態(tài)理解和文本生成能力外,MiniGPT5還支持提供合理、連貫的多模態(tài)信息輸出。
OpenAI奧特曼:簡(jiǎn)單模仿&封裝ChatGPT的公司活不久
9月22日-24日,OpenAI CEO奧特曼出席YC Alumni Reunion 2023校友會(huì),并做演講,他提出一些創(chuàng)業(yè)建議。據(jù)網(wǎng)友總結(jié),其觀點(diǎn)大致可以分為三點(diǎn):
此外有消息稱,奧特曼在本次演講中劇透了下一代大模型的研發(fā)方向,并稱GPT-5和GPT-6將具備多模態(tài)輸出能力,相比目前的GPT版本可靠性更高、個(gè)性化定制體驗(yàn)更好。