在“擴散模型”中,AI生成圖像的過程主要是通過以下哪種方式實現的?
從一張清晰圖片開始,逐步增加噪點直到變成白雜訊
從隨機噪點開始,逐步去除雜訊並還原出有意義的圖像
從已有圖片庫中直接複製相似度最高的圖片
從文字描述中提取關鍵字,再拼接不同圖片的局部紋理
早期AI生成漢字時經常出現“亂碼”,主要原因是什麼?
AI的算力不足,無法處理彩色圖像
AI沒有安裝中文字體庫
AI把漢字當成了複雜的“花紋”或紋理,不理解筆劃結構
AI只學會了英文,無法識別中文
ORC是什麼意思?
Optical Card Reader / 光卡閱讀器
Optical Character Recognition / 光學字元識別
Original Character Recording / 原始字元記錄
Online Character Retrieval / 線上字元檢索
OCR技術的主要功能是什麼?
將圖像中的文字轉換為可編輯的文本
將音頻信號轉換為文字
將手寫體自動轉換成印刷體
將低解析度圖像放大並修復細節
為什麼引入OCR作為“考官”能顯著提升AI生成文字的準確率?
OCR可以即時修改AI生成的錯誤文字
OCR能自動為AI提供更多訓練圖片
OCR能檢測生成圖裏的文字是否正確,並將錯誤作為回饋信號訓練AI
OCR會刪除所有包含文字的圖片,避免干擾
某研究團隊發現,即使使用了高質量的提示詞和OCR回饋,AI在生成長篇中文書法作品時仍然會出現個別錯字。根據課程內容,以下哪項推測最不合理?
訓練數據中缺乏足夠的連筆行書或草書樣本
OCR模型本身對潦草字體的識別準確率有限,導致回饋信號存在雜訊
AI在反向擴散過程中對整幅畫的全局一致性優先於局部文字的精准性
擴散模型無法處理超過20個字元的文字序列
OCR技術不僅能識別印刷體文字,還能識別手寫體文字。
以下哪些是AI生成“四格漫畫”時確保角色對話文字清晰可讀的有效策略?
在提示詞中寫明“所有對話框內的中文必須清晰,無錯別字”
將對話框的背景色設置為與文字高對比的顏色
要求AI先生成無文字的漫畫,再手動添加文字
使用“黑體、印刷體、清晰可讀”等關鍵字描述文字樣式