iPAS 114年第四次初級AI應用規劃師-人工智慧基礎概論試題解答

🌈️ 點選題目可顯示解答與相關背景知識說明。

🌈️ 引用本站解答請註明出處 https://ipas.tw


1.  在人工智慧系統的決策流程中,下列哪一種情境最符合「人在迴圈上(Human-over-the-loop)」所強調的監督機制?

(A) AI 系統只能提供建議,人類需主動下達命令才能進行決策;
(B) 人類對 AI 的運行進行日常監督,必要時可立即介入修正或干預;
(C) 人類平時不參與 AI 的運作,僅在發生異常或重大錯誤時才接手控制;
(D) AI 的所有判斷與行動在執行前,皆須經過人類逐一審核與批准

看解答

正確答案是 (B) 人類對 AI 的運行進行日常監督,必要時可立即介入修正或干預。

這題考察的是人工智慧治理中「人類參與程度」的三種核心模式:Human-in-the-loop (HITL)、Human-on-the-loop (HOTL) 以及 Human-out-of-the-loop (HOOTL)。

(B) 為正確答案 (Human-over-the-loop, HOTL):

核心概念: 人類扮演的是「監督者(Overseer)」或「守護者」的角色。AI 系統可以自主運行並執行任務,但人類在旁邊全程監控(就像在塔台監控自動駕駛的飛機),當發現系統偏離預期、效率低下或出現潛在危險時,人類可以立即介入(Override)或終止操作。

關鍵點: AI 具備一定程度的自主權,人類不需要「逐一審核」,但保留了「隨時干預」的最高權力。

(A) 與 (D) 錯誤 (Human-in-the-loop, HITL):

這兩項描述的是「人在迴圈內」。在這種模式下,AI 只是輔助,每一項決策或行動執行前,都必須經過人類的核准或觸發。沒有人類的動作,系統就不會進行下一步。

(C) 錯誤 (Human-out-of-the-loop, HOOTL):

這描述的是「人在迴圈外」。系統完全自主運行,人類平時不參與也不監控,通常只有在系統徹底崩潰或事後稽核時才會介入。 

人機互動模式對照表

模式名稱 人類的角色 AI 的自主程度 典型例子
Human-in-the-loop 操作者/審核者 低。每步需人點頭。 醫生根據 AI 影像分析做診斷。
Human-over-the-loop 監督者/管理者 中。可自動執行,人隨時準備介入。 自動化工廠的中央監控員。
Human-out-of-the-loop 不直接參與者 高。完全自動決策。 高頻率自動交易系統。

解題關鍵:
In (在裡面):每動一下都要人看。
Over (在上面):AI 自己動,人在上面看著,不對勁就出手。
Out (在外面):AI 自己跑,人不在現場。


2. 下列哪一種特徵工程技巧,最適合將「星期幾」和「24 小時制時間」這兩個欄位結合,以預測通勤時間?

(A) One-hot 編碼(One-hot encoding);
(B) 正規化(Normalization);
(C) 特徵交叉(Feature Cross);
(D) 寬深模型(Wide and Deep)

看解答

正確答案是 (C) 特徵交叉(Feature Cross)。

這題考察的是如何處理特徵之間的「交互作用(Interaction)」。在預測通勤時間時,單獨看「星期幾」或「時間」往往不足以精確判斷,兩者的組合才是關鍵。

(C) 為正確答案:

核心概念: 特徵交叉是將兩個或多個特徵合併,形成一個新的複合特徵。

本題應用: 「週一」這個特徵與「早上 8 點」這個特徵分開看時,資訊量有限。但當它們「交叉」成 [週一, 08:00] 時,模型就能明確學到「週一早尖峰」的交通特性。同理,[週日, 08:00] 的交通狀況顯然與週一完全不同。透過特徵交叉,線性模型也能學到這些非線性的組合規律。

(A) 錯誤: One-hot 編碼常用於將類別資料(如:台北、台中、高雄)轉為數值向量。雖然「星期幾」適合用 One-hot,但它無法直接將兩個欄位的「關係」結合在一起。

(B) 錯誤: 正規化是將數值特徵(如:房價、身高)縮放到特定的範圍(如 0 到 1),目的是為了加快模型收斂,與特徵結合無關。

(D) 錯誤: 寬深模型(Wide & Deep)是一種 模型架構(由 Google 提出),它確實利用了特徵交叉(在 Wide 部分)。但題目問的是「特徵工程技巧」,(C) 才是最底層且直接的技巧名稱。

為什麼「通勤時間」需要特徵交叉?

原始特徵 A (星期) 原始特徵 B (小時) 交叉特徵 [A x B] 預測意義
週一 08:00 週一早尖峰 交通極度擁堵
週六 08:00 週六早晨 交通通暢
週五 18:00 週五晚尖峰 返鄉與聚餐車潮,最塞

解題關鍵:當你需要模型理解 「A 在 B 情況下會有不同表現」(即特徵間有相關性)時,最直接的特徵工程方法就是 特徵交叉 (Feature Cross)。這能有效捕捉特徵間的非線性關係,顯著提升預測準確度。


3. 關於 ETL(Extract-Transform-Load),下列敘述何者為正確?

(A) E 表示將資料直接儲存至目標儲存庫;
(B) ETL 的處理順序可以自由調整為 TEL;
(C) L 表示將目標儲存庫經過反加密處理載入資料;
(D) T 包括資料的清理與排序

看解答

正確答案是 (D) T 包括資料的清理與排序。

ETL 是資料倉儲(Data Warehouse)中最重要的數據處理流程,代表著數據從源頭到目標地的三個階段:

(D) 為正確答案 (Transform - 轉換):

T (Transform) 是 ETL 的核心。在資料從來源端取出後,通常是雜亂或格式不一的。

主要任務: 包括 資料清理(去除重複值、修正錯誤)、排序、格式轉換(例如將日期從 2026/04/30 改為 2026-04-30)、聚合(計算總和或平均值)以及資料驗證。

(A) 錯誤 (Extract - 擷取):

E (Extract) 的意思是從各種不同的原始資料源(如資料庫、日誌檔、API)中將資料「讀取」出來,而非直接存入目標儲存庫。

(B) 錯誤 (順序固定):

ETL 的邏輯順序是固定的:先擷取 (E),接著在暫存區進行轉換 (T),最後才載入 (L) 到目標系統。雖然現在有一種新的模式叫 ELT(先載入到大數據平台再利用平台的算力進行轉換),但並沒有 "TEL" 這種說法。

(C) 錯誤 (Load - 載入):

L (Load) 的純粹定義是將處理好的資料「寫入」最終的目標儲存庫(如 Data Warehouse 或 Data Lake)。雖然載入過程可能涉及安全性設定,但將其定義為「反加密處理」是不正確且過於狹隘的。

ETL 流程示意與功能

階段 全名 核心動作 關鍵字
E Extract (擷取) 從多個源頭抓取原始數據。 讀取、來源
T Transform (轉換) 清理、格式化、排序、過濾。 加工、品質控管
L Load (載入) 將加工後的數據存入目的地。 寫入、儲存庫

解題關鍵:理解 ETL 的字面意義即可解題。只要記得 T (Transform) 就是在幫資料「做醫美與整隊」,就很容易聯想到 清理 (Cleaning) 與 排序 (Sorting)。


4. 關於資料正則化(Regularization)L1、L2 方法,下列敘述何者正確?

(A) L1 權重個數愈多,愈可以提升模型的正確率;
(B) L2 稱為 Lasso 正則化;
(C) L1 運用減少權重的絕對值來控制模型的複雜度;
(D) L2 較 L1 正則化方法會將特徵權重趨近於零

看解答

正確答案是 (C) L1 運用減少權重的絕對值來控制模型的複雜度。

這題考察的是機器學習中防止過度擬合(Overfitting)的兩種主要正則化技術:L1 (Lasso) 與 L2 (Ridge)。

(C) 為正確答案:
L1 正則化是在損失函數中加入「權重絕對值之和」作為懲罰項(Penalty term)。其數學形式為 \(\lambda \sum |w|\)。
透過減少權重的絕對值,模型會傾向於將不重要的特徵權重直接壓縮為 0,從而簡化模型,這也是一種自動進行「特徵選擇」的機制。

(B) 錯誤:
L1 稱為 Lasso 正則化。
L2 稱為 Ridge 正則化。

(D) 錯誤:
L1 正則化比較容易產生「稀疏解(Sparse solution)」,也就是會產生許多 剛好為零 的權重。
L2(權重平方和,\(\lambda \sum w^2\))則是將權重「縮小」到接近零的值,但通常不會真的變成零。

(A) 錯誤:
正則化的目的通常是為了「犧牲一點點訓練集的正確率」來換取更好的「泛化能力(Generalization)」。權重個數過多往往是過度擬合的特徵,正則化反而是要透過限制權重來防止模型變得太複雜。

L1 (Lasso) vs. L2 (Ridge) 快速對照表

特性 L1 正則化 (Lasso) L2 正則化 (Ridge)
懲罰項 權重的 絕對值 w
對權重的影響 會將不重要的權重變為 0 將權重縮小至 趨近於 0
主要功能 特徵選擇、產生稀疏模型 防止模型參數過大、提高穩定性
模型複雜度 顯著降低(變量減少) 降低(參數變小但數量不變)

解題關鍵:
看到 L1 聯想 絕對值、Lasso、權重變 0。
看到 L2 聯想 平方、Ridge、權重變小但不為 0。


5. 在機器學習中,「偏差與變異權衡(Bias-Variance Tradeoff)」主要用來解決下列哪一類型的問題?

(A) 因資料來源或收集方式限制,導致模型學習到的資訊不足;
(B) 測試資料樣本與訓練資料高度重複,造成模型泛化能力評估失準;
(C) 訓練資料中類別分布不均,使模型在少數類別上表現不佳;
(D) 如何在模型偏差與變異之間取得平衡,以避免過度擬合或欠擬合

看解答

正確答案是 (D) 如何在模型偏差與變異之間取得平衡,以避免過度擬合或欠擬合。

這題考察的是機器學習中最核心的理論之一:偏差與變異權衡(Bias-Variance Tradeoff)。這是每一個資料科學家在訓練模型時都必須面對的取捨問題。

(D) 為正確答案:

偏差(Bias): 指模型預測值與真實值之間的誤差。高偏差代表模型太簡單(例如用直線去擬合曲線),沒有學到資料的規律,導致 「欠擬合(Underfitting)」。

變異(Variance): 指模型在不同訓練集上表現的波動程度。高變異代表模型太複雜(例如記住了訓練資料中的所有雜訊),導致模型對新資料的預測很不穩定,這就是 「過度擬合(Overfitting)」。

權衡(Tradeoff): 我們的目標是讓「總誤差(Total Error = Bias² + Variance + Noise)」最小化。當我們降低偏差時,模型通常會變得複雜,變異隨之升高;反之亦然。因此,需要在兩者間找的一個平衡點。

(A) 錯誤: 這是指資料本身的品質問題。雖然資訊不足會導致高偏差,但「權衡」理論主要是探討模型複雜度與誤差分布的關係,而非解決資料收集的限制。

(B) 錯誤: 這描述的是「資料洩漏(Data Leakage)」的問題,會導致我們誤以為模型表現很好,實際上模型只是在「背答案」,這會讓評估指標失效。

(C) 錯誤: 這描述的是「類別不平衡(Class Imbalance)」問題。解決方法通常是透過重新取樣(Oversampling/Undersampling)或調整權重,與偏差與變異的權衡理論屬於不同維度的挑戰。

偏差與變異的直觀理解(打靶理論)

類型 模型複雜度 現象 特徵
高偏差 (High Bias) 太簡單 欠擬合 (Underfitting) 訓練集與測試集表現都很差。
高變異 (High Variance) 太複雜 過度擬合 (Overfitting) 訓練集表現極好,但測試集表現極差。
理想模型 適中 良好的泛化能力 兩者皆低,總誤差最小。

解題關鍵:看到 Bias-Variance Tradeoff,關鍵字就是 「平衡」 以及解決 「過度擬合 (Overfitting)」與「欠擬合 (Underfitting)」 的問題。


6. 在 Lasso 模型中,L1 正則化(Regularization)導致參數收斂為零的原因為何?

(A) L1 正則化忽略目標變數;
(B) L1 對梯度有平滑作用;
(C) L1 對大係數懲罰較強,促使稀疏解;
(D) L1 會轉換損失函數為非凸形

看解答

正確答案是 (C) L1 對大係數懲罰較強,促使稀疏解。

這題深入探討了 Lasso (L1) 正則化與 Ridge (L2) 正則化在數學本質上的差異。

(C) 為正確答案:
核心機制: L1 正則化的懲罰項是權重的 絕對值之和 (\(\lambda \sum |w|\))。在幾何圖形上,L1 的約束區域是一個帶有「尖角」的菱形。當損失函數的等值線與這個菱形相交時,交點極大機率會發生在座標軸上(即某個維度的數值為 0)。
稀疏解 (Sparse Solution): 這種特性會強制將不重要的特徵係數直接壓縮為 0,這種結果被稱為「稀疏性」。這使得 Lasso 不僅能防止過度擬合,還具備了自動「特徵選擇」的功能。

(A) 錯誤: L1 正則化是附加在損失函數(Loss Function)上的,而損失函數的核心就是衡量預測值與「目標變數」的差距,並沒有忽略目標變數。

(B) 錯誤: 事實上,L2 正則化(Ridge) 才具有平滑作用。因為 L1 在 w=0 處是不可微的(尖角),其梯度是不連續的;而 L2 的平方項是平滑的曲線,能使權重均勻縮小。
(D) 錯誤: L1 與 L2 正則化與線性回歸結合後,產生的依然是 凸函數 (Convex Function)。這保證了模型可以找到全局最優解,而非轉變為非凸形。

L1 與 L2 在幾何上的直觀差異

想像損失函數的等值線在擴張,去觸碰約束邊界:

L1 (Lasso) 的邊界是「正方形/菱形」: 等值線最容易撞到菱形的「頂點」,而頂點都在軸上(其中一個座標為 0)。
L2 (Ridge) 的邊界是「圓形」: 等值線通常會撞在圓弧面上,雖然座標值會變得很小,但很難剛好等於 0。

解題關鍵:看到 L1 或 Lasso 導致 「參數為零」,關鍵字就是 「稀疏解 (Sparse solution)」 或 「特徵選擇」。這也是 L1 最具代表性的數學特性。


7. 貝氏分類器(Naive Bayes Classifier)常被應用於文字分類、垃圾郵件過濾等場景。依據模型特性,它最適合歸類於下列哪一類?

(A) 透過直接學習輸入特徵與目標標籤之間的邊界或關係來進行分類的模型;
(B) 透過建構資料的整體分布,並利用條件關係進行推斷和分類的模型;
(C) 側重探索資料中樣本間的相似性,將資料自動分成不同群組的模型;
(D) 透過試錯學習,根據行動結果的獎勵或懲罰來優化決策策略的模型

看解答

正確答案是 (B) 透過建構資料的整體分布,並利用條件關係進行推斷和分類的模型。

這題考察的是機器學習中 「判別式模型 (Discriminative Models)」 與 「生成式模型 (Generative Models)」 的基本區別。

(B) 為正確答案:

生成式模型特性: 貝氏分類器屬於「生成式模型」。它不只是尋找分類邊界,而是去學習每一種類別(如:垃圾郵件 vs. 正常郵件)背後的機率分佈。

運作邏輯: 它利用「貝氏定理」,結合 先驗機率(資料中垃圾郵件的比例)與 條件機率(垃圾郵件中出現「中獎」這個詞的機率),來推算出給定一段文字時,它是屬於某個類別的後驗機率。這正是選項中提到的「建構整體分布」與「利用條件關係進行推斷」。

(A) 錯誤 (判別式模型):

這描述的是如 支持向量機 (SVM)、邏輯回歸 (Logistic Regression) 或 神經網路。這些模型不關心資料怎麼生成的,它們只關心如何在不同類別之間劃出一條最強的「邊界」。

(C) 錯誤 (非監督式學習):

這描述的是 分群 (Clustering) 演算法,如 K-means。貝氏分類器是「監督式學習」,需要標籤資料來訓練,而不是自動分群。

(D) 錯誤 (強化學習):

這描述的是 強化學習 (Reinforcement Learning)。貝氏分類器是基於統計機率的靜態分類,不涉及透過環境獎懲來優化策略。

生成式 vs. 判別式模型小筆記

模型類型 核心特點 常用演算法
生成式 (Generative) 學習資料的機率分布 \(P(X|Y)\)。 貝氏分類器、隱馬可夫模型 (HMM)。
判別式 (Discriminative) 直接學習分類邊界 \(P(Y|X)\)。 邏輯迴歸、SVM、決策樹。

解題關鍵:看到 貝氏 (Bayes),關鍵字就是 「條件機率」 與 「機率分布」。它是透過理解資料「長什麼樣子」來進行分類,而非僅僅在資料間畫線。


8. 為提升生成式 AI 系統回應的語境一致性,常會結合哪類模型技術?

(A) 決策樹分類器(Decision Tree Classifier);
(B) 條件語言模型(Conditional Language Model);
(C) 強化學習 Q-learning 函數模型;
(D) 基因演算法(Genetic Algorithm)

看解答

正確答案是 (B) 條件語言模型(Conditional Language Model)。

這題考察的是生成式 AI(Generative AI)如何處理「有意義的對話」與「語境(Context)」。

(B) 為正確答案:
核心定義: 「條件語言模型」是指模型在生成文字時,會根據給定的 「條件(Condition)」(例如前文對話、特定的指令或是提示詞)來預測下一個字。
語境一致性: 為了確保 AI 說出的話與前面的對話邏輯一致,模型必須將「之前的語境」作為條件輸入。目前的 LLM(如 GPT 系列)本質上都是複雜的條件語言模型,它們計算的是 \(P(\text{下一字} | \text{前文語境})\),這正是維持對話連貫性的技術基礎。

(A) 錯誤: 決策樹主要用於分類與回歸任務。它是透過一連串的「是非題」來劃分資料,並不具備處理長序列文字或生成自然語言的能力,無法用於提升語境一致性。

(C) 錯誤: Q-learning 是一種強化學習演算法,常用於機器人控制或遊戲策略(如 AlphaGo)。雖然目前的 AI 會使用 RLHF(人類回饋強化學習)來優化模型,但那主要是為了對齊人類偏好,而非「語境一致性」的核心生成技術。

(D) 錯誤: 基因演算法是一種啟發式搜尋演算法,模擬生物演化過程(突變、交叉、選擇)來尋找最佳解。它與語言模型的語境預測與生成邏輯無關。

條件語言模型的運作邏輯

元件 作用
輸入 (Condition) 使用者的提問 + 歷史對話紀錄。
運作 (Modeling) 在給定的語境條件下,計算所有可能出現的下一個字的機率。
輸出 (Output) 選擇機率最高的字,並將其加入語境中,重複此過程。

解題關鍵:提升 「語境(Context)」 與 「生成(Generation)」 的一致性,關鍵字就是 「條件(Conditional)」。這代表模型的輸出是「有前提」的,而非隨機產生。


9. 根據 2025 年 9 月行政院通過之《人工智慧基本法》草案,政府推動人工智慧之「創新實驗環境」制度,主要參考歐盟的何種制度?

(A) Data Protection Impact Assessment;
(B) Regulatory Sandbox;
(C) AI Trust Label;
(D) AI Ethics Review Board

看解答

正確答案是 (B) Regulatory Sandbox。

這題考察的是政府如何平衡「科技創新」與「法律監管」。在人工智慧快速發展的背景下,為了避免法律限制過於死板而阻礙創新,各國紛紛引入了「監理沙盒」的概念。

(B) 為正確答案:

Regulatory Sandbox(監理沙盒 / 創新實驗環境): 這是指在一個受控的安全環境中(如同小孩子玩的沙盒),政府允許業者在一定的範圍與期間內,暫時豁免某些現行法律規範,測試開發中的 AI 創新產品或服務。

歐盟參考: 歐盟的《人工智慧法》(EU AI Act)明確要求各會員國應建立「AI 監理沙盒」,提供一個有利於創新的實驗場景,讓廠商在進入市場前能先進行驗證。台灣的《人工智慧基本法》草案正是參考此設計。

(A) 錯誤 (DPIA):

這是「資料保護衝擊評估」。主要是在處理大量個人敏感資料前,評估可能對個人隱私造成的風險,屬於法遵管理,而非「創新實驗環境」。

(C) 錯誤 (AI Trust Label):

這是「AI 可信標章」。類似於節能標章或食品安檢標章,是用來證明該 AI 產品符合安全、透明等規範的識別,不涉及法律豁免的實驗環境。

(D) 錯誤 (AI Ethics Review Board):

這是「AI 倫理審查委員會」。其職責是審核 AI 的應用是否符合倫理道德(如公平性、不歧視),屬於審查機制,而非實驗場域。

「監理沙盒」制度的核心價值

特點 說明
法律豁免 在實驗期間,暫時放寬或調整相關法規的適用。
受控環境 必須在政府監控下進行,並確保對使用者或社會的風險可控。
快速迭代 幫助開發者快速收集數據、修正錯誤,縮短創新落地時間。
輔導性質 監理機關與業者在過程中密集溝通,政府也能藉此了解是否需要修正現行法律。

解題關鍵:看到 「創新實驗環境」,在金融科技或 AI 法律領域,對應的標準術語就是 「監理沙盒 (Regulatory Sandbox)」。


10. 根據《金融機構運用人工智慧技術作業規範》,金融機構須建立內部治理架構,並指定專責單位或人員負責推動及管理人工智慧事務,下列何者並非規範所明訂須落實的治理措施?

(A) 辦理人工智慧人才培育;
(B) 清楚了解生成式 AI 技術之運作模式;
(C) 每日公布人工智慧系統運作狀況;
(D) 指派高階主管或委員會進行監督管理

看解答

正確答案是 (C) 每日公布人工智慧系統運作狀況。

這題考察的是台灣金融監管單位對 AI 導入的治理(Governance)要求。根據現行規範,核心目標是「負責任的 AI」,而非過度的資訊公開。

(C) 為正確答案(非規範明訂):

透明度不代表即時公開: 規範要求的是「透明度與可解釋性」,意指金融機構需向客戶說明 AI 的使用範圍、對客戶權益的影響(如:是否由 AI 決定授信額度),以及在發生糾紛時提供解釋。

無需每日公布: 要求金融機構「每日公布」系統運作狀況,在實務上既不具備監理意義,也會造成極大的行政負擔與資訊安全風險,因此並非規範要求。

(A) 錯誤(是規範內容):

金融機構必須強化內部人員對 AI 的認知與操作能力,這屬於「職能與培訓」的一部分,以確保員工能正確且安全地使用 AI 工具。

(B) 錯誤(是規範內容):

金融機構在導入 AI(尤其是黑盒子的生成式 AI)前,必須進行風險評估。如果連技術如何運作、資料如何流轉都不了解,就無法落實風險控管,這與「資料主權」與「資安管控」息息相關。

(D) 錯誤(是規範內容):

這是「內部治理架構」的核心。規範要求必須有明確的「權責歸屬(Accountability)」,通常是成立 AI 委員會或指定高階主管(如 CTO 或總經理級別)負責決策,確保 AI 策略與經營目標一致且符合法令。

金融機構運用 AI 之治理核心原則

治理維度 具體要求
權責歸屬 必須有高階管理層負責。
透明與解釋 告知客戶 AI 的參與程度。
公平與非歧視 確保演算法不會對特定群體有偏見。
隱私與安全 資料必須去識別化,且不能外洩至未受控環境。

解題關鍵:法律規範通常強調 「架構(單元/主管)」、「能力(人才)」 與 「風險(了解技術)」。凡是要求 「每日」、「即時」 或 「全面公開內部技術細節」 的選項,通常都是過度誇張的干預,不符合實際監理常態。


11. 下列哪一類問題最適合使用非監督式學習(Unsupervised Learning)來處理?

(A) 根據已標記的醫療影像訓練模型診斷疾病;
(B) 根據使用者行為將用戶分群,以優化行銷策略;
(C) 透過已知交通事故記錄預測未來事故發生機率;
(D) 根據歷史股價預測未來股市的走勢

看解答

正確答案是 (B) 根據使用者行為將用戶分群,以優化行銷策略。

這題考察的是「監督式學習」與「非監督式學習」最根本的區別:是否有「標記(Label)」或「標準答案」。

(B) 為正確答案:

核心概念: 非監督式學習是在處理沒有標記的資料。系統的目標是從中尋找隱藏的模式、結構或規律。

分群(Clustering): 這是非監督式學習最典型的應用。企業手頭有大量的使用者行為資料,但事先並不知道誰屬於哪一類,透過演算法(如 K-means),系統會根據資料間的相似度,自動將性質接近的用戶歸為一群(例如:高頻高貢獻者、潛在流失者),這正是「分群」的本質。

(A) 錯誤(監督式學習):

題目提到「已標記的」醫療影像。模型需要學習影像(輸入)與診斷結果(輸出/標籤)之間的對應關係,這屬於「分類」任務。

(C) 錯誤(監督式學習):

透過「已知紀錄」來「預測機率」,這需要利用過去發生的事實作為標籤來訓練模型,屬於「回歸」或「分類」任務。

(D) 錯誤(監督式學習):

歷史股價是輸入,未來走勢是目標輸出。模型學習的是時間序列與數值間的映射關係,屬於「回歸」任務。

機器學習兩大類別快速對照表

特性 監督式學習 (Supervised) 非監督式學習 (Unsupervised)
資料狀態 有標籤 (With Labels) 無標籤 (No Labels)
主要目的 預測未來、分類。 尋找資料中的結構、規律。
經典任務 分類 (Classification)、回歸 (Regression) 分群 (Clustering)、降維 (Dimension Reduction)

解題關鍵:看到 「分群」、「自動分類(但無預設類別)」、「尋找共同特徵」,對應的就是 非監督式學習。反之,只要有「根據已知...預測...」或「已標記」字眼,通常都是監督式學習。


12. 下列哪一種圖表最適合用來呈現並分析「兩個數值型變數」之間的關係,例如觀察身高與體重的相關性?

(A) 散佈圖(Scatter Plot);
(B) 折線圖(Line Chart);
(C) 直方圖(Histogram);
(D) 長條圖(Bar Chart

看解答

正確答案是 (A) 散佈圖(Scatter Plot)。

這題考察的是資料視覺化中,如何根據資料類型選擇正確的圖表來呈現變數間的關係。

(A) 為正確答案:

核心用途: 散佈圖專門用於呈現兩個數值型變數(Continuous variables)之間的相關性。

本題應用: 將「身高」放在 X 軸,「體重」放在 Y 軸,每一個點代表一個樣本。透過點的分布趨勢,可以直觀地觀察兩者是否存在正相關、負相關或無相關。如果點大致呈直線排列,還能進一步進行迴歸分析。

(B) 錯誤:

折線圖最適合用來呈現時間序列資料,即觀察某個數值隨時間變動的趨勢(如:股市走勢、每月降雨量)。

(C) 錯誤:

直方圖是用來觀察「單一數值變數」的次數分配或機率分布(如:全班考試分數的分布情況),無法同時比較兩個變數的關係。

(D) 錯誤:

長條圖主要用於比較類別型變數之間的數值大小(如:不同縣市的人口數、不同產品的銷售額)。

常見圖表選擇指南

圖表類型 適合資料類型 最佳分析目標
散佈圖 兩個數值變數 探討相關性 (Correlation)
折線圖 時間 + 數值 觀察趨勢 (Trend)
長條圖 類別 + 數值 比較大小 (Comparison)
直方圖 單一數值 觀察分布 (Distribution)

解題關鍵:當題目要求觀察 「兩個數值變數」(如 X 與 Y)的 「相關性」 時,散佈圖 始終是首選工具。


13. 下列哪一項應用情境與機器學習類型搭配正確?

(A) 在醫療影像資料中,僅有少部分影像有專家標註診斷,其餘大多數影像未標註,研究者結合已標註與未標註資料來建立模型 — 監督式學習(Supervised Learning);
(B) 在自駕車模擬環境中,模型透過試駕獲得「是否安全通過路口」的獎勵或懲罰訊號,逐步調整決策策略 — 非監督式學習(Unsupervised Learning);
(C) 在顧客購買紀錄中,利用已知的「顧客是否流失」標籤,訓練模型以預測新顧客未來是否會流失 — 強化式學習(Reinforcement Learning);
(D) 在股票市場資料中,輸入歷史股價序列,嘗試將未來可能走勢劃分成若干「上升型、盤整型、下降型」群組,無需使用任何標籤 — 非監督式學習(Unsupervised Learning)

看解答

正確答案是 (D) 在股票市場資料中,輸入歷史股價序列,嘗試將未來可能走勢劃分成若干「上升型、盤整型、下降型」群組,無需使用任何標籤 — 非監督式學習(Unsupervised Learning)。

這題考驗的是對機器學習四大類別(監督式、非監督式、強化式、半監督式)的定義與實際應用場景的理解。

(D) 為正確答案:

核心關鍵: 「無需使用任何標籤」且「劃分成若干群組」。

這屬於非監督式學習中的 「分群(Clustering)」 任務。模型直接從原始資料中尋找規律,將相似特徵的資料歸類,符合非監督式學習的定義。

(A) 錯誤:

情境描述: 同時結合「少部分已標註」與「大量未標註」資料。

正確分類: 這稱為 「半監督式學習(Semi-supervised Learning)」,而非單純的監督式學習。這常用於標註成本極高的領域(如醫療、法律)。

(B) 錯誤:

情境描述: 透過「獎勵(Reward)」或「懲罰(Penalty)」訊號來逐步優化策略。

正確分類: 這是典型的 「強化式學習(Reinforcement Learning)」。模型像生物一樣透過與環境互動、試錯來學習,而非非監督式學習。

(C) 錯誤:

情境描述: 利用「已知標籤(是否流失)」來訓練模型預測新資料。

正確分類: 這是標準的 「監督式學習(Supervised Learning)」 中的「二元分類(Classification)」任務,而非強化式學習。 

機器學習類型與關鍵特徵對照表

學習類型 資料特徵 關鍵動作 本題情境範例
監督式 有標籤 (Label) 預測、分類 (C) 預測顧客流失
非監督式 無標籤 (No Label) 分群、降維 (D) 股價走勢分群
強化式 獎勵/懲罰 (Reward) 試錯、優化策略 (B) 自駕車決策
半監督式 部分有標籤 結合兩者優勢 (A) 醫療影像標註不足

解題關鍵: 看到 「標籤」 → 監督式。
看到 「無標籤/自動分群」 → 非監督式。
看到 「獎懲/環境互動」 → 強化式。
看到 「部分標籤」 → 半監督式。


14. 某企業分析團隊正在處理一組近兩年的營運與銷售數據,共有四個部門提出了各自的分析需求,請判斷哪一個最接近「預測性分析(Predictive Analysis)」的特性?

(A) 視覺化所有產品線過去月銷售走勢與標準差,觀察其分佈情況與波動程度;
(B) 藉由資料比對分析,找出去年母親節促銷失效的地區與品類組合;
(C) 建構模型推算下一季的主力商品銷量,以規劃備貨與倉儲資源配置;
(D) 透過熱圖分析廣告投放成本與訂單轉換率之間的潛在關聯性

看解答

正確答案是 (C) 建構模型推算下一季的主力商品銷量,以規劃備貨與倉儲資源配置。

這題考察的是數據分析的四個層次:敘述性(Descriptive)、診斷性(Diagnostic)、預測性(Predictive) 以及 處置性(Prescriptive)。

(C) 為正確答案 (Predictive Analysis):

核心概念: 預測性分析的目的是回答 「未來會發生什麼?(What will happen?)」。

本題應用: 透過歷史數據建構模型,推算「下一季」的銷量。這涉及到利用已知資料來估計未知的未來趨勢,是標準的預測性分析應用,能直接輔助企業進行資源的前瞻性配置。

(A) 錯誤 (Descriptive Analysis - 敘述性分析):

視覺化「過去」的走勢、標準差、分布情況,是在回答 「發生了什麼事?(What happened?)」。這屬於對現狀與歷史事實的客觀描述。

(B) 錯誤 (Diagnostic Analysis - 診斷性分析):

找出去年的活動為什麼在特定地區「失效」,是在回答 「為什麼發生?(Why did it happen?)」。透過資料比對找出原因,屬於診斷與分析問題根源。

(D) 錯誤 (Diagnostic Analysis - 診斷性分析):

分析成本與轉換率之間的「潛在關聯性」,旨在理解變數之間的交互關係,這通常也是診斷性分析的一環,用來解釋目前的成效表現。

數據分析的四個階段

階段 目標問題 關鍵字 範例
敘述性 發生了什麼? 視覺化、統計量、過去 銷售報表、儀表板。
診斷性 為什麼發生? 關聯性、下鑽分析、原因 找出業績下滑的關鍵因素。
預測性 未來會怎樣? 模型推算、預估、下一季 銷量預測、流失率預測。
處置性 該怎麼做? 最佳化、決策建議、模擬 自動化備貨系統、路徑最佳化。

解題關鍵:看到 「預測性」,直接尋找描述 「未來 (Future)」 或 「預估 (Forecast)」 動作的選項。


15. 某模型使用 K-近鄰演算法(KNN)進行分類,K 設為 3。 一筆新的測試資料輸入後,與其最接近的 3 筆資料的類別如下:鄰近樣本 1:類別A;鄰近樣本 2:類別 B;鄰近樣本 3:類別 A。請問模型會將這筆資料預測為哪一類別?

(A) 類別 A;
(B) 類別 B;
(C) 類別 A 與 B 各一半,無法分類;
(D) 類別 A 或 B,視距離遠近加權而定

看解答

正確答案是 (A) 類別 A。

這題考察的是 K-近鄰演算法(K-Nearest Neighbors, KNN) 的核心決策機制——多數決(Majority Voting)。

(A) 為正確答案:
核心邏輯: KNN 是一種「少數服從多數」的演算法。當我們設定 K=3 時,模型會尋找距離測試資料最近的 3 個鄰居,並統計這些鄰居所屬的類別。
投票結果:
類別 A:2 票(鄰近樣本 1、3)
類別 B:1 票(鄰近樣本 2)
因為 2 > 1,所以模型會根據投票結果,將該測試資料預測為票數最多的 「類別 A」。

(B) 錯誤: 類別 B 只得 1 票,在多數決機制下不會被選中。

(C) 錯誤: 雖然存在不同類別,但票數並非相等(2 vs 1),因此可以明確分類。

(D) 錯誤(易混淆項):
雖然在進階的 KNN 變體中可以加入「距離加權(Distance Weighting)」,讓離得更近的鄰居話語權更大,但在標準的 KNN 演算法中,預設採用的是「簡單多數決」。即便要考慮加權,題幹中並未提供具體距離數值,且最終結果仍會指向單一類別。

KNN 演算法小檔案

特性 說明
基本原理 近朱者赤,近墨者黑(根據鄰居決定自己)。
K 的意義 要參考多少個鄰居。
決策方式 多數決投票。
優點 簡單直觀,無需訓練模型(Lazy Learning)。
缺點 計算量大(要算所有點的距離),對雜訊敏感。

解題關鍵:看到 KNN 分類問題,直接數各種類別出現的次數,次數最多的即為答案。


16. 某團隊想採用循環神經網路(Recurrent Neural Network, RNN)建構長期氣候數據的預測模型,以下哪一項敘述最符合使用 RNN 可能會遇到的挑戰?

(A) RNN 無法處理可變長度的序列輸入,因此在實務上限制極大;
(B) RNN 在長序列訓練中可能出現梯度消失,影響模型效果;
(C) RNN 無法捕捉時間上的依賴關係,因此預測準確度低;
(D) RNN 只能用於分類任務,不能應用於時間序列預測

看解答

正確答案是 (B) RNN 在長序列訓練中可能出現梯度消失,影響模型效果。

這題考察的是傳統循環神經網路(RNN)在處理長序列數據時最著名的技術瓶頸。

(B) 為正確答案:

核心問題: RNN 的特性是將先前的資訊傳遞到下一刻,但在訓練過程中(透過時間反向傳播,BPTT),如果序列很長,梯度(Gradient)在經過多次乘法運算後會變得極小,這就是 「梯度消失(Vanishing Gradient)」。

影響: 當梯度消失時,模型會失去學習「長期依賴關係」的能力。以氣候預測為例,模型可能只記得昨天的天氣,卻忘記了幾個月前的季節性規律。

(A) 錯誤:

RNN 的一大優點正是它 可以處理 可變長度的序列輸入,這讓它在自然語言處理(NLP)和時間序列分析中非常受歡迎。

(C) 錯誤:

RNN 的設計初衷就是為了捕捉 時間上的依賴關係。雖然傳統 RNN 處理「長」依賴有困難,但它確實具備捕捉時間關係的能力。

(D) 錯誤:

RNN 廣泛應用於 時間序列預測(如氣價、股價、氣候)、語音辨識和翻譯等多個領域,並非只能用於分類。

如何克服 RNN 的挑戰?

為了優化傳統 RNN 的缺點,後續發展出了更先進的變體:

․ LSTM (Long Short-Term Memory): 透過「閘門機制(Gate Mechanism)」來決定資訊的留存與遺忘,有效解決梯度消失問題。

․ GRU (Gated Recurrent Unit): LSTM 的簡化版本,計算效率更高。

解題關鍵:提到 RNN 的 「挑戰」 或 「缺點」,標準答案通常圍繞在 「梯度消失 (Vanishing Gradient)」 或 「難以捕捉長期記憶」。


17. 一間金融科技公司設計一款智慧投資系統,該系統會根據市場變化自動決定「買進」、「持有」或「賣出」的行動,並根據每次交易後的盈虧結果,逐步優化下一次的投資策略。整個過程中,系統不依賴事先標記的資料,而是根據歷次行動獲得的獎勵進行調整。請問此系統最可能採用哪一種學習方法?

(A) 強化式學習(Reinforcement Learning);
(B) 監督式學習(Supervised Learning);
(C) 非監督式學習(Unsupervised Learning);
(D) 遷移學習(Transfer Learning)

看解答

正確答案是 (A) 強化式學習(Reinforcement Learning)。

這題描述的是機器學習中非常經典的「代理人(Agent)與環境互動」模式。

(A) 為正確答案:

核心機制: 強化式學習的特點在於 「試錯(Trial and Error)」 與 「獎懲機制」。系統(代理人)在市場(環境)中做出動作(買進、持有、賣出),隨後環境會給予回饋(盈虧結果,即獎勵或懲罰)。

優化目標: 系統的目標是透過不斷的嘗試,找到能讓長期累積獎勵(總利潤)最大化的最佳策略。這完全符合題目中提到「不依賴標記資料」、「根據歷次行動獲得的獎勵進行調整」的描述。

(B) 錯誤:

監督式學習需要一組「標準答案(標籤)」,例如告訴 AI:當股價為 100 元時「正確答案」就是買進。但題目強調系統是根據「盈虧結果」自行優化,而非依賴預先標記。

(C) 錯誤:

非監督式學習主要用於「分群(Clustering)」或「降維」,旨在發現資料中隱藏的結構。它不會根據行動的結果(獎懲)來學習如何決策。

(D) 錯誤:

遷移學習是指將一個已經訓練好的模型(例如辨識貓狗的模型)所學到的知識,應用到另一個相關領域(例如辨識老虎)。這與題目描述的決策優化邏輯不符。

強化式學習 (RL) 的四大要素

要素 本題中的實際對應
代理人 (Agent) 智慧投資系統
環境 (Environment) 金融市場
行動 (Action) 買進、持有、賣出
獎勵 (Reward) 交易後的盈虧結果(獲利為正,虧損為負)

解題關鍵:看到 「行動(Action)」、「獎勵(Reward)/ 懲罰」、「逐步優化策略」,這三個組合在一起就是 強化式學習 的標準定義。


18. 關於 Q-Learning 與 Deep Q-Learning,下列敘述何者最正確?

(A) Q-Learning 與 Deep Q-Learning 的差異在於是否使用標記資料作為學習基礎;
(B) Q-Learning 可處理任意維度的狀態空間,因此比 Deep Q-Learning 更靈活;
(C) Deep Q-Learning 透過深度神經網路近似 Q 值,避免了 Q 表在高維空間中難以擴展的問題;
(D) Deep Q-Learning 無法搭配經驗回放(Experience Replay),因為會導致樣本順序被打亂

看解答

正確答案是 (C) Deep Q-Learning 透過深度神經網路近似 Q 值,避免了 Q 表在高維空間中難以擴展的問題。

這題考察的是傳統強化學習 Q-Learning 與結合深度學習的 Deep Q-Learning (DQN) 之間的演進關係。

(C) 為正確答案:

Q-Learning 的限制: 傳統 Q-Learning 使用「Q 表(Q-Table)」來儲存每一個「狀態-動作」對應的數值。當狀態(如影像像素)變得非常複雜時,表格會變得無比巨大(即維度災難),電腦記憶體無法負荷。

DQN 的突破: DQN 引入了神經網路來當作「函數近似器」。它不再查表,而是將狀態輸入網路,讓網路直接「算」出每個動作的 Q 值。這使得模型能處理像電玩畫面、機器人感測器等複雜的高維度資訊。

(A) 錯誤:

兩者都屬於強化學習,是根據「獎勵訊號」學習,而非使用傳統監督式學習的「標記資料」。它們的差異在於處理狀態空間的方式(查表 vs. 神經網路)。

(B) 錯誤:

事實剛好相反。Q-Learning 只能處理有限且離散的小型狀態空間;Deep Q-Learning 因為使用神經網路,處理複雜環境的能力遠比 Q-Learning 更強大且靈活。

(D) 錯誤:

經驗回放(Experience Replay) 恰恰是 DQN 成功的關鍵技術之一!它將過去的經驗存入記憶池並隨機採樣,目的是打破樣本之間的相關性,讓模型訓練更穩定。所以「樣本順序被打亂」在 DQN 中反而是一個優點。

Q-Learning vs. Deep Q-Learning (DQN)

特性 Q-Learning Deep Q-Learning (DQN)
儲存方式 Q-Table (表格) 神經網路 (NN)
適用場景 簡單、狀態少的環境 複雜、高維度環境 (如:Atari 遊戲)
擴展性 差 (維度災難) 強 (函數近似)
核心技術 貝爾曼方程式 (Bellman Eq) 卷積神經網路 + 經驗回放

解題關鍵:看到 Deep Q-Learning,關鍵字就是 「深度神經網路」 與解決 「高維度空間」(表格存不下)的問題。


19. 在訓練機器學習模型時,若任務為預測房價,應選用下列哪一種損失函數(Loss Function)來衡量預測誤差?

(A) 均方誤差(MSE);
(B) 交叉熵損失(Cross-Entropy Loss);
(C) Hinge 損失(Hinge Loss);
(D) KL 散度(Kullback-Leibler Divergence)

看解答

正確答案是 (A) 均方誤差(MSE)。

這題考察的是如何根據任務類型(回歸或分類)選擇合適的損失函數(Loss Function)。

(A) 為正確答案:

回歸任務(Regression): 預測房價屬於回歸任務,因為目標值(房價)是連續性的數值。

均方誤差(Mean Squared Error, MSE): 其計算方式是將「預測值與真實值之差」取平方後求平均。平方項能確保誤差永遠為正,且會放大較大的誤差,促使模型盡可能精確地擬合數值,是房價預測等回歸問題中最常用的標準損失函數。

(B) 錯誤(分類任務):

交叉熵損失(Cross-Entropy Loss): 主要用於分類問題(如辨識貓或狗)。它衡量的是兩個機率分佈之間的差異。房價是具體金額而非機率,因此不適用。

(C) 錯誤(分類任務):

Hinge 損失: 最常用於支持向量機(SVM),旨在尋找最大分類間隔。它適用於「是或否」的分類決策,而非數值預測。

(D) 錯誤(分佈比較):

KL 散度: 用於衡量一個機率分佈與另一個分佈的差異,常用於生成模型(如 VAE)或知識蒸餾,不適合直接用來衡量房價這種單一數值的預測誤差。

損失函數選擇快查表

任務類型 目標範例 推薦損失函數
回歸 (Regression) 房價預測、銷量預估 MSE (均方誤差)、MAE (平均絕對誤差)
二元分類 垃圾郵件判斷 (是/否) Binary Cross-Entropy
多元分類 手寫數字辨識 (0-9) Categorical Cross-Entropy
邊界分類 找最大間隔 Hinge Loss

解題關鍵:當題目提到 「預測數值」(如房價、溫度、股價)時,直覺反應就是要找 MSE 或 MAE 相關的回歸損失函數。


20. 某醫院希望開發一個系統,根據患者的年齡、血壓與 BMI 等資訊,預測其罹患糖尿病的機率(0~1),並依據預測值是否超過 0.5 做出風險警示。下列哪一種模型最適合用此分類任務?

(A) 邏輯迴歸(Logistic Regression);
(B) 支援向量機(Support Vector Machine);
(C) 決策樹(Decision Tree);
(D) K 平均演算法(K-means)

看解答

正確答案是 (A) 邏輯迴歸(Logistic Regression)。

這題考察的是模型在處理「機率預測」與「二元分類」時的特性。

(A) 為正確答案:

核心功能: 邏輯迴歸雖然名稱中有「迴歸」,但它實際上是處理 二元分類 最經典的模型。它的輸出會通過 Sigmoid 函數,將計算結果轉換為一個介於 0 到 1 之間 的數值。

機率解讀: 這個 0 到 1 的輸出值在實務上常被解讀為「機率」。題目中明確提到要預測「罹患機率(0~1)」並設定「0.5 作為閥值」,這完全符合邏輯迴歸的運作邏輯與數學基礎。

(B) 錯誤:

支援向量機 (SVM) 的核心是尋找能區隔類別的最大間隔邊界(Hyperplane)。雖然它可以進行分類,但它的原始輸出是資料點相對於邊界的距離,並非直觀的機率值(雖然可以透過額外的轉換如 Platt Scaling 來達成,但不如邏輯迴歸直接)。

(C) 錯誤:

決策樹 是透過一連串的是非條件(如:血壓是否 > 140?)將資料劃分到葉子節點。雖然它可以輸出某類別的比例,但其主要優勢在於規則的解釋性,而非精確的機率模型化。

(D) 錯誤:

K 平均演算法 (K-means) 屬於「非監督式學習」中的 分群(Clustering) 演算法。它是在沒有標籤的情況下自動將資料分類,無法根據「是否罹病」的歷史資料進行監督訓練,更無法輸出特定類別的發生機率。

邏輯迴歸與機率預測

邏輯迴歸之所以適合本題,關鍵在於其使用的 Sigmoid 函數 方程式:
$$P(y=1|x) = \frac{1}{1 + e^{-z}}$$
這能保證輸出結果一定落在 (0, 1) 區間,讓醫護人員能直接觀察到「機率」的高低,而不僅僅是一個「是或否」的答案。

解題關鍵:看到 「預測機率值(0~1)」 並搭配 「0.5 為判定標準」,在機器學習基礎考題中,通常指的就是 邏輯迴歸 (Logistic Regression)。


21. 某金融科技公司正開發一套違約風險預測系統,需大量處理不同客戶的財務特徵資料。考量到資料特徵數量眾多,且希望提升預測的穩定性與泛化能力,下列哪一種鑑別式 AI 模型最適合?

(A) 邏輯迴歸(Logistic Regression);
(B) 支援向量機(Support Vector Machine);
(C) 決策樹(Decision Tree);
(D) 隨機森林(Random Forest)

看解答

正確答案是 (D) 隨機森林(Random Forest)。

這題考察的是在處理「多特徵資料」時,如何選擇具有高穩定性與泛化能力的模型。

(D) 為正確答案:

集成學習(Ensemble Learning): 隨機森林是一種整合了多棵「決策樹」的模型。它透過「隨機森林」的概念,讓每棵樹只學習一部分的特徵與資料。

穩定性與泛化能力: 單一模型(如決策樹)容易發生「過擬合(Overfitting)」,即在訓練資料表現完美,但在新資料(泛化)表現差。隨機森林透過多數決投票的方式抵銷了單一樹的偏差,顯著提升了預測的穩定性。

處理多特徵: 隨機森林非常擅長處理具有大量特徵(High-dimensional data)的資料,且能評估特徵的重要性,非常適合金融違約預測這種複雜的場景。

(A) 錯誤:

邏輯迴歸雖然運算快速且具解釋性,但在處理大量非線性特徵或特徵間存在複雜交互關係時,預測效果通常不如隨機森林。

(B) 錯誤:

支援向量機 (SVM) 在處理極大量特徵與大量樣本時,計算成本(記憶體與時間)會變得非常高。此外,它對參數(如 Kernel 選擇)極為敏感,泛化調整較為困難。

(C) 錯誤:

決策樹最大的弱點就是「不穩定」。資料只要有微小的變動,整棵樹的結構就可能完全改變,且非常容易過擬合。

隨機森林的優勢對照

特性 隨機森林 (Random Forest)
抗過擬合 強(透過多棵樹平均誤差)。
資料處理 優(不需對特徵進行高度縮放,能處理缺失值)。
泛化能力 優(模型結構穩健,對新資料適應力強)。
特徵處理 自動選擇重要特徵,適合特徵眾多的金融數據。

解題關鍵:看到 「特徵數量眾多」 且強調 「穩定性」 與 「泛化能力」,通常指的就是集成學習演算法,其中最經典的代表就是 隨機森林。


22. 關於變分自編碼器(Variational Autoencoder, VAE)的運作流程,下列何者敘述最為正確?

(A) 解碼器的任務是將低維壓縮向量分類為不同類別;
(B) 編碼器將輸入資料轉換為可視化圖像以利模型學習;
(C) 編碼器將資料轉換為潛在空間表示,解碼器再重建資料;
(D) 編碼器利用最大邊際機率對資料進行異常點偵測

看解答

正確答案是 (C) 編碼器將資料轉換為潛在空間表示,解碼器再重建資料。

這題考察的是生成式 AI 領域中非常重要的模型:變分自編碼器(VAE)的基本架構與運作邏輯。

(C) 為正確答案:
核心架構: VAE 由兩大部分組成:編碼器(Encoder) 與 解碼器(Decoder)。
運作流程:
1. 編碼器:負責將高維度的輸入資料(如一張圖片)壓縮,轉換為一個低維度的潛在空間(Latent Space)表示。在 VAE 中,這個表示通常是一組機率分佈( 平均值 μ 與標準差 σ )。
2. 解碼器:從潛在空間中採樣,嘗試將這些壓縮後的資訊還原,重建(Reconstruct)出與原始輸入盡可能接近的資料。

(A) 錯誤:解碼器的任務是「重建原始資料」或「生成新樣本」,而非執行分類任務。

(B) 錯誤:編碼器的目的是將資料「壓縮」與「特徵提取」,轉換成數學上的向量或分佈,而非為了可視化圖像。

(D) 錯誤:雖然 VAE 確實可以延伸應用於異常偵測(透過重建誤差來判斷),但這並非其核心定義的運作流程。此外,編碼器的運作並非基於「最大邊際機率」進行分類。

VAE 運作原理

組件 作用
編碼器 (Encoder) 降維。將輸入資料映射到潛在空間的分佈參數。
潛在空間 (Latent Space) 壓縮後的特徵表示,通常符合正態分佈。
解碼器 (Decoder) 升維。根據潛在空間的特徵,重新構建或生成資料。

解題關鍵:自編碼器(Autoencoder)家族的標準口訣就是:「編碼壓縮,解碼還原」。看到編碼器對應「潛在空間」,解碼器對應「重建資料」,即為正確答案。


23. 下列何者不是我國數位發展部 AI 產品與系統評測中心對生成式 AI 的評測項目?

(A) 當責性;
(B) 可靠性;
(C) 隱私及資安;
(D) 互動性

看解答

正確答案是 (D) 互動性。

這題考察的是台灣數位發展部(數發部) 針對 AI 技術監理的核心標準。為了確保 AI 的安全性與可信賴度,數發部參考國際趨勢(如 NIST AI Risk Management Framework),建立了「AI 產品與系統評測中心(AICU)」。

(D) 為正確答案:

評測重點在於「安全」與「道德」: 官方評測中心的成立目的,是為了檢驗 AI 是否具備風險、是否公平或是否安全。

「互動性」屬於產品體驗: AI 聊天好不好玩、回話快不快、互動是否自然,屬於**市場競爭力或使用者體驗(UX)**的範疇,並非政府評測中心驗證「可信賴 AI」的核心安全指標。

(A)、(B)、(C) 均為核心評測類別:
根據數發部公布的評測框架,主要針對以下維度進行測試:

當責性 (Accountability): 確保 AI 決策有紀錄可循,且開發者需負擔相應責任。

可靠性 (Reliability): 測試 AI 在不同情況下的穩定性,是否會產生嚴重的幻覺(Hallucination)或錯誤資訊。

隱私及資安 (Privacy & Security): 檢查 AI 是否會洩漏訓練資料中的個資,以及是否容易受到駭客攻擊(如提示詞注入)。

其他重要項目: 還包括 公平性(是否有偏見)、透明度 與 安全性。

台灣 AI 評測中心 (AICU) 核心框架

評測維度 說明
安全性 是否會產生危害性、歧視性或違法的內容。
可靠性與強健性 模型在各種異常輸入下是否依然能維持穩定輸出。
資料保護 模型運作過程是否符合個資法,有無隱私外洩風險。
透明性 模型的運作邏輯與資料來源是否可被追溯或理解。

解題關鍵:政府機構的「評測」通常聚焦在 「安全 (Security)」、「法律 (Law)」、「道德 (Ethics)」 三大主軸。凡是偏向 「商業價值」 或 「美觀/易用性(如互動性、美觀度)」 的選項,通常都不在政府的強制評測標準內。


24. 在保持 GPT-OSS 模型架構不變的前提下,如果將模型參數量從 20 億提升至 120 億,並假設有足夠的訓練資料支撐,下列敘述何者最正確?

(A) 模型參數增加會線性提升效能,且即使訓練資料不變也不會遇到瓶頸;
(B) 參數越多模型推理越快,因為每層可以並行計算更多參數;
(C) 較大的參數量能提升模型的表達能力與預測效能,但需足夠訓練資料支持;
(D) 增加參數量不影響記憶體使用,只會影響計算速度 

看解答

正確答案是 (C) 較大的參數量能提升模型的表達能力與預測效能,但需足夠訓練資料支持。

這題考察的是大型語言模型(LLM)中參數量(Parameters)、效能與數據量之間的關係,這通常與 AI 領域著名的「縮放法則(Scaling Laws)」相關。

(C) 為正確答案:

表達能力(Capacity): 參數量代表模型的「記憶空間」與「邏輯複雜度」。從 20 億增加到 120 億,模型能學習到更細微的語意關聯與複雜知識。

數據支持的必要性: 根據 DeepMind 的 Chinchilla Scaling Laws,模型大小與訓練數據量必須同步成長。如果參數量巨大但訓練資料不足(Over-parameterized),模型容易產生過擬合,且無法發揮大參數應有的效能潛力。

(A) 錯誤:

非線性提升: 效能提升通常呈現邊際效益遞減,而非簡單的「線性」成長。

訓練資料瓶頸: 敘述中提到「訓練資料不變也不會遇到瓶頸」是錯誤的。若資料量固定,模型參數量過大反而會導致效能停滯甚至衰退。

(B) 錯誤:

參數越多,推理越慢: 模型每生成一個字(Token),都需要運算所有的參數。120 億參數的模型在進行一次前向傳播(Inference)時,計算量遠大於 20 億參數模型,因此推理速度會顯著變慢,而非變快。

(D) 錯誤:

記憶體佔用顯著增加: 模型參數必須加載到顯示卡記憶體(VRAM)中。120 億參數所需的記憶體空間約為 20 億參數的 6 倍。參數量增加對記憶體容量的要求是非常直接且巨大的影響。

參數量增加帶來的影響對照

影響項目 20 億 → 120 億 參數
邏輯推理能力 顯著提升 (Emergent Abilities)
運算成本 (Compute) 增加 (訓練與推理皆需更多算力)
記憶體需求 (VRAM) 大幅增加 (約 6 倍)
所需訓練資料量 必須增加 (以避免過擬合)

解題關鍵:大模型的核心邏輯是 「大參數 + 大數據 = 強能力」,且必須記住:參數越多,硬體負擔(記憶體、計算時間)越重。


25. 在自然語言處理任務中,為了減少訓練語料中偏見對模型的影響,下列哪種資料處理策略屬於常見的「資料去偏(Data Debiasing)」做法?

(A) 讓模型在訓練時隨機替換輸出,以抵消資料中存在的系統性偏差;
(B) 增加模型的參數量,依賴更大的模型自動消除原始資料中的偏見;
(C) 調整或擴充訓練語料,使不同群體或類型資料的比例更加平衡,避免模型過度偏向出現頻率高的類別;
(D) 對訓練資料施加額外正則化或噪音,使模型在學習過程中對偏見敏感度降低

看解答

正確答案是 (C) 調整或擴充訓練語料,使不同群體或類型資料的比例更加平衡,避免模型過度偏向出現頻率高的類別。

這題考察的是如何從資料端(Data-level)解決機器學習中常見的偏見問題,這在 AI 倫理與可信賴 AI 中是非常重要的實作環節。

(C) 為正確答案:

核心邏輯: 模型產生偏見(Bias)的最主要原因,通常是因為訓練資料中存在不平衡(例如:歷史語料中,「醫生」多連結到男性,「護理師」多連結到女性)。

資料增強(Data Augmentation): 透過人為調整樣本權重或「對抗性資料擴充」(例如:刻意加入「女性醫生」或「男性護理師」的語料),可以打破模型對特定標籤的刻板關聯,使模型學習到更客觀的規律。這是目前最直接且常見的去偏方法。

(A) 錯誤:

隨機替換輸出會導致模型學習到的邏輯發生混亂,且會嚴重降低模型的預測準確度(Accuracy),並非一種科學的去偏策略。

(B) 錯誤:

大模型不等於無偏見: 事實上,研究指出參數量越大的模型(如 GPT 系列),往往會因為抓取了更多人類社會的網路語料,而將社會中存在的隱性偏見「放大」。大模型需要更嚴格的後續對齊(Alignment)才能減少偏見。

(D) 錯誤:

正則化(Regularization): 正則化的主要目的是防止「過擬合(Overfitting)」,提升泛化能力,但它無法識別什麼是「偏見」資訊,因此無法針對性地降低模型對偏見的敏感度。

常見的 AI 去偏(Debiasing)方法分類

層次 常用手法
資料層面 (Data) 重新採樣、資料平衡 (如選項 C)、對抗性數據擴充。
演算法層面 (Algorithm) 引入公平性約束函數、更改損失函數權重。
輸出層面 (Post-processing) 針對敏感結果進行後端過濾或人工對齊 (RLHF)。

解題關鍵:「資料去偏」 的首要工作就是修正 「資料的不平等」。看到 「調整比例」、「平衡資料」、「擴充群體資料」 等字眼,就是標準的資料端去偏做法。


26. 在深度學習模型的微調(Fine-tuning)過程中,可能出現所謂的「災難性遺忘(Catastrophic Forgetting)」。此現象最可能造成哪種情況?

(A) 由於計算資源或訓練步驟不足,模型在微調過程中無法完整收斂,導致學習效果受限;
(B) 微調後模型的表現變得隨機,無法有效記憶新學到的模式與知識;
(C) 微調後模型的部分權重產生偏移,導致模型無法針對較長的文字進行回應;
(D) 模型過度適應微調的資料分佈,逐漸遺忘先前預訓練所獲得的廣泛知識,在原有任務或廣泛領域上表現變差

看解答

正確答案是 (D) 模型過度適應微調的資料分佈,逐漸遺忘先前預訓練所獲得的廣泛知識,在原有任務或廣泛領域上表現變差。

這題考察的是遷移學習(Transfer Learning)中一個非常經典且棘手的問題:災難性遺忘(Catastrophic Forgetting)。

(D) 為正確答案:

核心現象: 當我們拿一個已經學會很多知識的預訓練模型(例如 GPT)去針對特定任務(如:法律文件摘要)進行微調時,如果微調的力道過大或方法不當,模型內部的神經元權重會為了迎合新資料而產生劇烈變動。

後果: 這會導致模型原本在預訓練階段學到的「通用常識」或「語言邏輯」被覆蓋掉。結果是模型雖然法律摘要做得很好,但卻變得不會寫詩、不會算數學,甚至連基本的對話能力都大幅退化。

(A) 錯誤:

這描述的是「欠擬合(Underfitting)」或訓練不足的問題,與遺忘先前知識無關。

(B) 錯誤:

災難性遺忘通常是指「舊的忘記了」,但「新的學得很好」。表現變得完全隨機通常是梯度爆炸或學習率設定極度錯誤導致模型崩潰。

(C) 錯誤:

無法回應長文字通常與模型的「上下文窗口(Context Window)」限制或位置編碼(Positional Encoding)有關,並非災難性遺忘的主要特徵。

如何解決「災難性遺忘」?

在實務上,研究者通常會使用以下技術來減輕這個問題:

1. 凍結層(Layer Freezing): 在微調時固定模型的前幾層(通常是學到基礎特徵的部分),只訓練最後幾層。

2. 彈性權重整合(Elastic Weight Consolidation, EWC): 對於預訓練中重要的權重,在更新時增加懲罰項,讓它們不容易被大幅更動。

3. 重播(Replay): 在微調資料中加入少量的預訓練資料,讓模型在學新知識時順便「複習」舊知識。

4. 低秩適配(LoRA): 這是目前最流行的微調方式,透過外掛小參數模組(Adapter)來學習新知識,而不去動原始預訓練的大模型權重。

解題關鍵:看到 「災難性遺忘」,請立刻聯想 「學了新任務,忘了舊任務」。


27. 在大型 Transformer 模型的效能優化過程中,常見的方法之一是「剪枝(Pruning)」。下列哪一項最符合該方法的核心概念?

(A) 將模型中所有權重按比例縮小,使其值更接近零,以降低計算量;
(B) 移除模型中影響較小或冗餘的部分權重參數,以減少模型大小並提升推理效率;
(C) 在訓練時僅更新部分權重而將其他權重凍結,從而減少需要調整的參數數量;
(D) 根據注意力分數動態跳過處理部分輸入 Token,以減少每次前向傳播的計算

看解答

正確答案是 (B) 移除模型中影響較小或冗餘的部分權重參數,以減少模型大小並提升推理效率。

這題考察的是模型壓縮(Model Compression)中的核心技術——剪枝(Pruning)。

(B) 為正確答案:
核心理念: 深度學習模型(尤其是 Transformer)通常是「過度參數化」的,這意味著模型中存在大量的冗餘權重。
作法: 透過分析權重的重要性(例如根據權重的大小 \(\ell_1\) 或 \(\ell_2\) 範數),將那些對模型輸出貢獻微乎其微的權重(Weight)或甚至整個神經元(Neuron)直接刪除(設為零)。目的: 這樣可以顯著減少模型的參數量,縮小檔案體積,並在支持稀疏矩陣運算的硬體上加速推理(Inference)速度。

(A) 錯誤(權重衰減):
這描述的是「權重衰減(Weight Decay)」或正則化(Regularization)的做法,目的是防止過擬合,而非移除參數以優化效能。

(C) 錯誤(參數高效微調):
這描述的是「參數高效微調(PEFT)」或「凍結(Freezing)」的概念,常用於微調階段(如 LoRA 或前述的遺忘防治),而不是為了壓縮已訓練好的模型。

(D) 錯誤(動態推理/Token 丟棄):
這屬於「動態計算(Dynamic Computation)」或「Token Pruning」,雖然也是一種優化方式,但傳統定義上的「模型剪枝(Model Pruning)」是指針對靜態權重結構的精簡,而非針對輸入資料的動態跳轉。

常見的模型優化技術對比

技術名稱 核心作法 主要目的
剪枝 (Pruning) 刪除冗餘權重或通道 減小模型體積、加速推理
量化 (Quantization) 將 32-bit 權重轉為 8-bit 或 4-bit 減少記憶體占用、加快運算
知識蒸餾 (Distillation) 大模型(教師)教小模型(學生) 訓練出效能接近大模型的小模型
知識分解 (Factorization) 將大矩陣分解為兩個小矩陣 減少計算量與參數數量

解題關鍵:看到 「剪枝 (Pruning)」,請聯想園藝修剪:把 「多餘的、不重要的枝葉 (參數)」 直接 「剪掉 (移除)」。


28. 對非常長的輸入序列進行推理(Inference),Transformer 模型推理的主要計算瓶頸通常是什麼?

(A) 模型輸出層產生文本的過程,因為每生成一個詞都必須重新訓練整個模型一次;
(B) 詞嵌入 (Embedding) 查找操作,因為其時間複雜度隨詞彙表大小指數級增長;
(C) Softmax 函數的計算,因為對每個 Token 都需要執行繁重的運算;
(D) 自注意力層的計算和其記憶體使用,因為注意力矩陣的大小隨序列長度呈平方級增長

看解答

正確答案是 (D) 自注意力層的計算和其記憶體使用,因為注意力矩陣的大小隨序列長度呈平方級增長。

這題考察的是 Transformer 架構在處理「長文本」時最核心的效能挑戰,也就是著名的 \(O(n^2)\) 複雜度問題。

(D) 為正確答案:
計算機制: 在自注意力(Self-Attention)機制中,序列中的每一個 Token 都必須與序列中的「每一個其他 Token」進行比對以計算相關性(Attention Score)。
平方級增長(Quadratic Complexity): 如果輸入序列長度為 \(n\),則注意力矩陣的大小為 \(n \times n\)。當長度翻倍(\(n \to 2n\))時,計算量和記憶體佔用會變成 4 倍。這導致在處理超長文本(如整本書或長合約)時,顯卡記憶體(VRAM)會迅速耗盡。

(A) 錯誤:推理不需訓練: 推理過程(Inference)只是執行模型的前向傳播,並不需要「重新訓練」模型。雖然生成每個詞確實有其開銷(自迴歸過程),但瓶頸不在於重新訓練。

(B) 錯誤:詞嵌入查找只是簡單的表格索引(Table Lookup),其時間複雜度相對於注意力機制來說微乎其微,且不會隨詞彙表大小「指數級」增長。

(C) 錯誤:雖然 Softmax 是注意力機制的一部分,但它只是對矩陣進行標準化。真正的瓶頸在於矩陣乘法所產生的 \(n^2\) 個元素,而非 Softmax 函數本身。

Transformer 的計算瓶頸:\(O(n^2)\)

為了克服這個瓶頸,業界開發了許多變體技術:FlashAttention:

1. 優化記憶體讀寫(IO),顯著提升長文本處理速度。
2. 稀疏注意力 (Sparse Attention): 讓 Token 只看周圍的鄰居,將複雜度降至線性。
3. 線性注意力 (Linear Attention): 改變計算順序,試圖消除 \(n^2\) 的限制。

解題關鍵:提到 Transformer 的 「長序列」 與 「瓶頸」,關鍵字永遠是 「自注意力 (Self-Attention)」 與 「平方級 (Quadratic / \(n^2\))」。


29. 在「可解釋人工智慧(Explainable AI, XAI)」領域中,LIME(Local Interpretable Model-agnostic Explanations)方法最核心的應用目的是什麼?

(A) 解釋單一樣本(局部預測)的黑箱模型決策過程;
(B) 全面提升黑箱模型整體的預測準確度;
(C) 將黑箱模型轉換成完全可解釋的模型作為替代;
(D) 用於生成大量擬真數據來替代訓練集

看解答

正確答案是 (A) 解釋單一樣本(局部預測)的黑箱模型決策過程。

這題考察的是 可解釋人工智慧 (XAI) 中非常知名的技術 LIME。理解它的縮寫與核心邏輯是解題關鍵。

(A) 為正確答案:

局部 (Local): LIME 不試圖解釋整個複雜模型的所有行為,而是專注於「為什麼這個特定的樣本(例如某張圖片或某個貸款申請人)會被判定為類別 X」。

模型無關 (Model-agnostic): 這是它的強大之處。無論背後是深度神經網路、隨機森林還是 SVM,LIME 都能運作,因為它把模型視為黑箱。

原理: LIME 在該樣本附近產生許多擾動(變動後的樣本),觀察黑箱模型的預測如何隨之變化,進而訓練一個簡單的、可解釋的模型(如線性迴歸)來模仿黑箱在「局部」的表現,從而告訴我們哪些特徵(如血壓、體重)對這次預測貢獻最大。

(B) 錯誤:

XAI 技術的目的是「解釋」,而不是提升模型的「準確度」。有時為了可解釋性,甚至可能需要犧牲一點效能。

(C) 錯誤:

LIME 只是提供一個「局部的解釋器」,並沒有改變或替換原本的黑箱模型。它是一個輔助工具,而非替代模型。

(D) 錯誤:

生成擬真數據是生成式 AI(如 GAN)的任務,與 LIME 的解釋機制無關。

XAI 方法小比較

方法 類型 解釋範疇
LIME 模型無關 (Model-agnostic) 局部 (單一樣本)
SHAP 基於博弈論 (Game Theory) 全域 + 局部 (具有數學一致性)
Saliency Maps 基於梯度 (Gradient-based) 局部 (常用於電腦視覺,顯示熱圖)

解題關鍵:記住 LIME 縮寫的第一個字母 L (Local),代表它最核心的功能就是提供 「局部」 的解釋。


30. 在醫療診斷決策支援系統等高風險領域中,「可解釋人工智慧(Explainable AI, XAI)」的核心價值最主要呈現在哪個面向?

(A) 透過提供可理解的決策依據,促進患者與醫療專業人員對系統診斷結果的信任與接受度;
(B) 以可解釋性方法優化臨床資料蒐集與管理流程,從而降低整體醫療作業成本;
(C) 利用解釋機制增強模型預測的統計顯著性與準確度,使其在研究及實務應用中更具科學性;
(D) 透過提供透明化的運作過程,進而減輕臨床人員負擔,並提升醫療服務的整體效率

看解答

正確答案是 (A) 透過提供可理解的決策依據,促進患者與醫療專業人員對系統診斷結果的信任與接受度。

這題考察的是 可解釋人工智慧 (XAI) 在特定垂直領域(如醫療、金融、法律)的核心應用價值。

(A) 為正確答案:

信任(Trust): 在醫療場景中,如果 AI 只是給出一個「癌症:機率 90%」的結果(黑箱決策),醫生很難僅憑此數據就執行高風險的手術。

透明度與接受度: XAI 能提供解釋(例如:標記出 X 光片上的異常陰影、顯示哪些生理指標導致該預測),這讓醫師能驗證 AI 的判斷是否符合醫學邏輯,進而建立信任。對於患者而言,了解診斷背後的「原因」也能提升對治療計畫的配合度與接受度。

(B) 錯誤:

優化資料蒐集與管理屬於「資訊管理」或「數據工程」的範疇,雖然重要,但並非 XAI(解釋模型決策)的核心目的。

(C) 錯誤:

解釋不等於準確: XAI 的目的是讓決策「可被理解」,它並不直接提升模型本身的「統計顯著性」或「預測準確度」。有時候,為了讓模型變得可解釋,甚至需要選用結構較簡單、準確度略低的模型。

(D) 錯誤:

雖然透明化可能間接優化流程,但 XAI 往往會增加臨床人員的「審核負擔」(因為醫生需要花時間閱讀並驗證解釋結果),所以它的首要目標並非「減輕負擔」或「提升效率」,而是確保 決策的安全與可靠性。

XAI 的四大核心價值 (以醫療為例)

價值維度 說明
可解釋性 (Interpretability) 醫師能理解 AI 是基於哪些特徵(如血壓、血糖)做出診斷。
可追溯性 (Traceability) 發生醫療糾紛時,能追溯 AI 當時的推論邏輯。
公平性 (Fairness) 確認 AI 沒有因為病患的種族、性別而產生偏見判斷。
安全性 (Safety) 防止模型因為資料雜訊(如 X 光片上的標記)而產生錯誤判斷。

解題關鍵:在高風險領域(醫療、軍事、法律),「信任 (Trust)」 與 「問責 (Accountability)」 永遠是 XAI 最優先考慮的面向。


31. 在金融科技公司的信貸決策系統中,導入反事實解釋(Counterfactual Explanation)時,實際部署往往伴隨技術與監管挑戰。下列哪一項最符合該情境下的核心挑戰?

(A) 需要建立完整的客戶行為預測模型來估算建議改變的實施成本,並整合到現有的風險管理系統架構中;
(B) 必須使用聯邦學習技術保護客戶隱私,同時在分散式環境中計算跨機構的反事實解釋結果;
(C) 需要建構時間序列因果圖來處理客戶信用狀況的動態變化,並預測未來可能的信用評分軌跡;
(D) 生成的反事實樣本必須滿足特徵間的因果約束和業務邏輯約束,同時確保建議的改變在現實中具有可操作性且符合公平放貸法規

看解答

正確答案是 (D) 生成的反事實樣本必須滿足特徵間的因果約束和業務邏輯約束,同時確保建議的改變在現實中具有可操作性且符合公平放貸法規。

這題考察的是 可解釋人工智慧 (XAI) 中一種非常實用的技術——反事實解釋(Counterfactual Explanation),以及它在受高度監管的金融領域所面臨的實務挑戰。

(D) 為正確答案:

什麼是反事實解釋? 它的核心邏輯是告訴使用者:「如果你當初做了某些改變,結果就會不同。」例如:「如果你的年收入多 10 萬元,且信用卡分期減少 2 筆,你的貸款就會核准。」

核心挑戰 1:因果與業務邏輯約束。 系統不能給出荒謬的建議。例如,不能建議客戶「如果你的年齡減少 5 歲就會核准」,因為年齡是不可變的特徵(特徵約束);或者建議「降低學歷但增加收入」,這可能違反現實邏輯。

核心挑戰 2:可操作性。 建議必須是客戶真的能做到的,否則這份解釋就沒有意義。

核心挑戰 3:合規與公平。 在金融法規下,解釋不能涉及歧視性特徵(如種族、性別),且必須確保建議的路徑對所有族群都是公平的。

(A) 錯誤:

雖然成本估算很重要,但反事實解釋的核心在於「告訴客戶如何改變以獲得不同結果」,而非「估算實施成本」。

(B) 錯誤:

聯邦學習(Federated Learning)是為了解決「資料不落地」的隱私技術,與「反事實解釋」的邏輯生成無直接必然的因果關係。

(C) 錯誤:

時間序列因果圖主要用於預測未來趨勢,而反事實解釋著重於針對「當下」的決策結果提供一個「改變現狀」的路徑。

反事實解釋的「可行性」三原則

原則 說明 範例
接近性 (Proximity) 修改的幅度越小越好。 建議增加 1 萬收入優於建議增加 100 萬。
稀疏性 (Sparsity) 變動的特徵數量越少越好。 只改「收入」一項,比同時改「收入、職業、住址」更容易理解。
現實性 (Feasibility) 變動必須是現實中可行且合邏輯的。 不能要求客戶改變性別、出生地或減少已發生的年齡。

解題關鍵:看到 「反事實解釋」 與 「金融挑戰」,請尋找強調 「建議的合理性/可操作性」 以及 「符合法規與邏輯約束」 的描述。


32. 在統計推論中,若樣本來自母體但呈現明顯偏態分布,且樣本數有限,下列哪一項策略最能減少推估母體參數的偏誤?

(A) 直接使用樣本平均數與變異數估計母體參數,不做任何調整;
(B) 增加樣本數並考慮使用分位數或中位數作為中心趨勢估計;
(C) 將樣本隨機重新排列後,多次計算平均值以消除偏態影響;
(D) 完全依賴樣本標準差來估計母體參數,忽略分布形態

看解答

正確答案是 (B) 增加樣本數並考慮使用分位數或中位數作為中心趨勢估計。

這題考察的是當資料不符合常態分佈(偏態分布)且樣本數較少時,如何進行穩健的統計推論。

(B) 為正確答案:

抗偏態性: 在明顯偏態(Skewed)的分布中,平均數(Mean) 極易受到極端值(Outliers)的拉動而偏離資料中心。相比之下,中位數(Median) 或 分位數 對極端值具有魯棒性(Robustness),更能代表資料的中心趨勢。

樣本數的影響: 根據「大數法則」,增加樣本數有助於縮小估計值的標準誤差,使推論更具代表性。

(A) 錯誤:

在偏態分佈且樣本有限的情況下,直接使用樣本平均數會導致對母體參數(如期望值)的估計產生嚴重偏誤,不具備穩健性。

(C) 錯誤:

隨機重新排列(Permutation) 通常用於假設檢定(如檢定兩組資料是否有顯著差異),但單純地對同一組樣本重新排列並計算平均值,其平均值永遠會是一樣的,無法「消除」原本資料結構中的偏態影響。

(D) 錯誤:

標準差是衡量資料的「離散程度」,而非「中心趨勢(母體參數)」。且在偏態分布中,標準差也會受到極端值的嚴重干擾,不能忽略分布形態。

統計估計策略對照

資料狀態 建議採用的中心趨勢 理由
對稱/常態分布 平均數 (Mean) 數學性質最優,計算最方便。
偏態分布 (有極端值) 中位數 (Median) 不受極端值影響,較能反映「典型」數值。
樣本數極少時 增加樣本或非參數統計 減少因偶然誤差導致的推論失敗。

解題關鍵:看到 「偏態 (Skewed)」 與 「減少偏誤」,關鍵策略通常是尋找 「中位數」 或 「非參數 (Non-parametric)」 的處理方式,因為它們對分布形狀的依賴較低。


33. 在工業物聯網架構中,進行設備預測性維護(Predictive Maintenance)時,若面對異常事件發生頻率極低、樣本高度不平衡的時間序列資料,下列哪一種方法最能兼顧模型穩定性與異常偵測效能?

(A) 將每筆異常事件資料複製多次以提升模型對異常的辨識敏感度,搭配全序列訓練模型(如 LSTM);
(B) 對時間序列進行差分與標準化後,使用傳統監督式學習模型(如 SVM)進行分類訓練;
(C) 使用經過時間序列特化的 SMOTE 技術生成異常樣本,以平衡異常與正常資料比例;
(D) 採用基於重建誤差的自編碼器模型( Sequence-to-Sequence Autoencoder)進行異常偵測,並僅使用正常資料進行訓練

看解答

正確答案是 (D) 採用基於重建誤差的自編碼器模型(Sequence-to-Sequence Autoencoder)進行異常偵測,並僅使用正常資料進行訓練。

這題考察的是在工業環境中處理 「極度不平衡資料(Class Imbalance)」 與 「異常偵測(Anomaly Detection)」 的實務策略。

(D) 為正確答案:

核心邏輯: 當異常樣本極其稀少時,傳統的監督式學習很難學到異常的特徵。因此,改用 「非監督式學習(Unsupervised Learning)」 的做法:只讓模型學習「正常狀態」長什麼樣子。

重建誤差(Reconstruction Error): 自編碼器(Autoencoder)會嘗試將輸入序列壓縮再還原。如果輸入的是正常資料,還原度會很高(誤差小);當異常事件發生時,因為模型從未學過這種模式,還原效果會很差(誤差大)。透過設定誤差閾值,就能有效偵測異常。

優勢: 不需要大量的異常標籤,且對未知的異常類型(Novelty Detection)也具備偵測能力。

(A) 錯誤:

過擬合風險: 單純複製異常樣本(Oversampling)會導致模型過度擬合那幾個特定的異常案例,對於「未見過」的機器故障類型完全沒有泛化能力。

(B) 錯誤:

特徵抓取能力不足: 傳統 SVM 雖然可以處理分類,但在處理複雜的「時間序列」動態特徵(如震動頻率、溫度漂移)時,表現遠不如深度學習模型。

(C) 錯誤:

破壞時間邏輯: SMOTE(Synthetic Minority Over-sampling Technique)在一般表格資料有效,但在「時間序列」中,隨機插值生成的資料往往會破壞物理上的時序邏輯(例如壓力不可能在 0.1 秒內無因果地劇增),生成的樣本在工業現實中並不合理。

工業異常偵測策略比較

策略類型 適用情境 優點 缺點
監督式學習 異常樣本充足 準確率高,分類明確。 需要大量標籤,無法偵測新形態故障。
過取樣 (SMOTE) 樣本輕微不平衡 平衡類別比例。 易產生雜訊,破壞時序物理邏輯。
重建誤差法 (VAE/AE) 異常極稀少 (本題) 不需異常標籤,可發現新故障。 需要定義合適的誤差閾值。

解題關鍵:看到 「異常頻率極低」 與 「樣本高度不平衡」,在 AI 實務上通常會轉向 「只學正常模式」 的異常偵測思維,關鍵字就是 「自編碼器 (Autoencoder)」 或 「重建誤差 (Reconstruction Error)」。


34. 在零售業進行客戶行為分析時,資料倉儲中發現多個欄位儲存相同的購買金額資訊(例如:amount_usd、total_price、transaction_value),但其單位、命名慣例及格式不一致,進而導致特徵工程階段混淆模型輸入。針對此種跨欄位語義重疊與結構冗餘問題,下列哪一種資料處理策略最合適且具實務可行性?

(A) 利用資料探勘技術自動選擇資料集中對目標變數最敏感的欄位,其他欄位捨棄即可,避免過度清理干擾原始結構;
(B) 保留所有相似欄位,交由高階模型(如 Gradient Boosting 或 Deep Learning)自動學習特徵關聯,無需手動處理;
(C) 建立欄位命名標準,統一金額單位與格式,進行欄位正規化與語義合併,減少重複資訊影響特徵重要性估計;
(D) 將重複欄位視為類別欄位,進行 One-hot 編碼(One-hot encoding)後輸入模型,以避免數值誤導模型學習過程

看解答

正確答案是 (C) 建立欄位命名標準,統一金額單位與格式,進行欄位正規化與語義合併,減少重複資訊影響特徵重要性估計。

這題考察的是資料清理(Data Cleaning)中的 「資料集成(Data Integration)」 與 「冗餘處理(Redundancy Handling)」,這是特徵工程中最基礎且關鍵的步驟。

(C) 為正確答案:

語義一致性: 題目中提到的三個欄位(amount_usd, total_price, transaction_value)在業務邏輯上指的是同一件事。若不處理,模型會認為這是三個獨立特徵,導致資訊冗餘。

正規化與合併: 實務上應先統一單位(例如全部換算成 USD)與格式,然後合併為單一欄位。這能有效降低特徵維度,並防止模型在計算「特徵重要性」時,將影響力分散到多個重複的欄位上,進而提升模型的解釋性與穩定性。

(A) 錯誤:

自動選擇的風險: 雖然特徵選擇(Feature Selection)可以自動篩選,但如果原始資料的單位(如美金 vs. 台幣)與格式不一,模型計算出的相關性會是錯誤的。「避免清理」反而會保留錯誤的數據結構。

(B) 錯誤:

垃圾進,垃圾出(GIGO): 雖然高階模型能學習特徵關聯,但冗餘且格式不一的資料會增加模型的訓練負擔,甚至導致「多重共線性(Multicollinearity)」問題,使模型變得不穩定,這並非專業的實務做法。

(D) 錯誤:

類型錯誤: 購買金額是「連續數值型資料」,將其視為「類別欄位」並進行 One-hot 編碼會導致維度爆炸(如果有 1000 種金額,就會產生 1000 個新欄位),且完全喪失了金額的大小邏輯。

資料整合的實務步驟

步驟 說明
語義衝突解決 確認不同的欄位名稱(如 amount vs. price)是否指向同一實體。
單位統一 將所有數值轉換為相同的基準(如貨幣匯率轉換、度量衡統一)。
去冗餘 使用相關性分析(Correlation Analysis)找出重複欄位並合併。
格式標準化 確保數值型態一致(如整數、浮點數、小數點位數)。

解題關鍵:當題目提到 「多個欄位表達相同意義」 且 「格式不一」 時,標準答案永遠是先 「統一標準、進行合併」,這就是所謂的資料清洗與整合。


35. 某大型零售企業準備將商品推薦模型上線,專案團隊在檢視訓練資料時,發現部分商品類別(例如高價商品)樣本數量極少,而多數樣本集中於低價商品。若此不平衡問題未妥善處理,下列何種狀況最可能在實際推薦結果中發生?

(A) 模型在預測時傾向輸出稀有類別,導致雖能捕捉到少數樣本,但精確率(Precision)顯著下降;
(B) 模型由於類別分布不均,難以建立有效的線性分離邊界,進而無法收斂;
(C) 模型過度聚焦於稀有類別樣本,導致對多數類別的預測能力下降,整體效能受損;
(D) 模型學到的決策邊界主要由多數類別主導,忽視了稀有類別,造成該類別的召回率(Recall)大幅降低

看解答

正確答案是 (D) 模型學到的決策邊界主要由多數類別主導,忽視了稀有類別,造成該類別的召回率(Recall)大幅降低。

這題考察的是機器學習中樣本不平衡(Class Imbalance)對模型行為產生的具體影響。

(D) 為正確答案:

多數類別主導: 在最小化損失函數(Loss Function)的過程中,模型為了追求最高的整體準確度(Accuracy),會傾向於去「討好」樣本數最多的類別。

忽視少數類別: 對於樣本極少的類別(如高價商品),模型可能直接將其判斷為多數類別(低價商品),因為這樣做對整體誤差的影響很小。

召回率(Recall)降低: 召回率衡量的是「有多少比例的真實稀有樣本被正確找出來」。當模型幾乎不預測稀有類別時,這些少數樣本就會被漏掉,導致召回率大幅下降。

(A) 錯誤:

通常情況下,模型會傾向於「不輸出」稀有類別,而非「傾向輸出」。只有在人為刻意過度補償少數類別(例如過度取樣)時,才可能出現精確率下降的情況,但題目問的是「未妥善處理」的情況。

(B) 錯誤:

樣本不平衡通常不會導致模型「無法收斂」,模型仍然可以收斂到一個局部最優解,只是這個解會極度偏向多數類別。

(C) 錯誤:

這描述的是對稀有類別「過擬合(Overfitting)」的情況,這通常發生在對少數類別進行過度採樣之後。在「未處理」的原始狀態下,模型通常是完全「忽視」稀有類別。

樣本不平衡的影響對照

類別 模型對待方式 統計指標影響
多數類別 (低價商品) 被過度學習,決策邊界由其定義。 預測結果幾乎全是此類別。
稀有類別 (高價商品) 資訊被雜訊淹沒,被視為例外。 召回率 (Recall) 極低,無法被推薦。

解題關鍵:當樣本不平衡且未處理時,模型會變得很「偷懶」,只猜測數量最多的那一類。這會導致少數那一類的東西「找不出來」,也就是 「召回率 (Recall)」 低下的問題。


36. 某電商資料團隊要協助行銷部門規劃再行銷策略。目前取得資料包含使用者點擊、購買紀錄、流量來源與轉換率。若資料團隊希望先進行探索性資料分析(EDA),下列哪一項最符合 EDA 的做法?

(A) 建立隨機森林模型,預測使用者是否會完成購買;
(B) 使用 K-means 對使用者群進行分群並立即制定對應促銷策略;
(C) 繪製各類流量來源對轉換率的關聯圖,尋找潛在關係;
(D) 對不同購物路徑設定統計假設並進行雙樣本 t 檢定

看解答

正確答案是 (C) 繪製各類流量來源對轉換率的關聯圖,尋找潛在關係。

這題考察的是 探索性資料分析(Exploratory Data Analysis, EDA) 的核心定義與執行順序。EDA 是在正式建模之前,用來了解資料特性、抓出異常值及尋找變數間關聯性的重要步驟。

(C) 為正確答案:

EDA 的核心: 強調利用視覺化工具(如散佈圖、長條圖、盒鬚圖)與描述性統計(均值、標準差)來「觀察」資料。

發掘潛在關係: 繪製流量來源與轉換率的關聯圖,能直觀地看出哪些管道(如 FB 廣告、Google 搜尋)表現較好,這正是 EDA 旨在「產生假設」而非「驗證假設」的典型做法。

(A) 錯誤:

建立隨機森林(Random Forest)屬於機器學習建模階段。EDA 應該發生在建模之前,用來決定哪些特徵該放入隨機森林中。

(B) 錯誤:

雖然分群(Clustering)有時會被用於進階 EDA,但「立即制定對應策略」跳過了驗證與評估階段。此外,EDA 階段通常更專注於資料的分布與品質,而非直接進行自動化分群決策。

(D) 錯誤:

設定統計假設並進行 t 檢定屬於推論統計(Inferential Statistics)或假設檢定階段。EDA 的目的是在沒有嚴格假設的情況下探索資料,而檢定則是為了「證實」或「否定」特定假設。

EDA (探索性資料分析) 的常見步驟

步驟 具體行為
資料品質檢查 檢查缺失值 (Missing values)、重複值或離群值。
單變量分析 繪製直方圖 (Histogram),觀察點擊次數或購買金額的分布。
多變量分析 使用相關係數矩陣或 散佈圖 (Scatter Plot),尋找變數間的關聯。
視覺化洞察 透過圖表找出資料中的趨勢、季節性或模式。

解題關鍵:看到 「EDA」,請尋找 「繪圖 (Plotting)」、「觀察分布」、「尋找關聯」 等非預測性的探索行為。它就像是正式烹飪前的「備料與檢查食材」。


37. 某金融科技公司在利用歷史交易資料建立風險控管模型時,嘗試推估整體詐騙交易比例。近期發現,樣本間存在明顯的時間序列相關性,導致模型在實際偵測新交易時誤判率升高。若希望同時改善詐騙比例推估的準確性並提升模型的穩健性,下列哪一種做法最為合適?

(A) 擴充樣本數量,以涵蓋更多潛在的詐騙型態,但維持既有的隨機抽樣方式不變;
(B) 採取時間序列敏感的抽樣策略,例如依據交易時間區間進行分層,以保存原始的時間結構特性;
(C) 將資料完全隨機打散,以降低序列相關性對模型訓練造成的影響;
(D) 在模型評估時,針對相鄰時間區段進行誤差合併,以便用整體估計方式修正詐騙比例

看解答

這題的正確答案是 (B) 採取時間序列敏感的抽樣策略,例如依據交易時間區間進行分層,以保存原始的時間結構特性。

這題的核心在於如何處理 「時間相關性(Time Autocorrelation)」 與防止 「資料洩漏(Data Leakage)」,這在金融風險控管中是極其關鍵的實務問題。

(B) 為正確答案:

時間結構的關鍵性: 金融交易(尤其是詐騙)具有強烈的新陳代謝特徵,詐騙手法會隨時間演進。如果破壞了時間順序,模型會學到「未來」的特徵來預測「過去」的交易,導致在實務應用時表現崩壞。

分層抽樣(Stratified Sampling): 依據時間區段進行分層抽樣或採用「滾動窗口(Rolling Window)」切分資料,能確保模型在訓練時考慮到不同時期的詐騙樣態變化,從而提升對未來新交易偵測的穩健性與比例推估的準確性。

(A) 錯誤:

隨機抽樣的弊端: 雖然擴大樣本數有助於捕捉多樣性,但「維持隨機抽樣」會導致樣本間的時間關聯被切斷,無法解決題目中提到的「時間序列相關性導致誤判率升高」的本質問題。

(C) 錯誤:

適得其反: 將資料「完全隨機打散」雖然在一般獨立同分佈(I.I.D.)資料中可行,但在具備時間序列特性的資料中,這樣做會人為地抹除趨勢、季節性與循環性。這會讓模型在訓練集看起來很準(因為學到了未來的資訊),但一上線(面對真實的時間流)就會失效。

(D) 錯誤:

治標不治本: 針對誤差進行合併與修正僅屬於「後處理(Post-processing)」手段。它雖然能調整最終的比例推估,但無法解決模型在訓練階段就因為忽略時間特性而產生的「誤判率升高」問題。

金融風控資料處理要點

處理環節 核心策略 目的
資料切分 Time-based Split (而非 Random Split) 防止「用未來預測過去」。
抽樣方法 分層抽樣 (依時間、依類別) 確保每個時期的極端詐騙案件都有被代表。
特徵工程 導入時間滑動窗口特徵 (Moving Average) 捕捉近期交易行為的動態變化。

解題關鍵:當題目提到 「時間序列相關性」 導致 「誤判率升高」,最佳解通常是 「尊重並保存時間結構」,即選項中的 「時間序列敏感」 策略。


38. 某公司建置基於檢索增強生成(RAG)的知識查詢系統,需同時兼顧查詢效能與資料的即時更新。近期發現回應內容偶爾過時,且每次更新文件都需完整重建索引,導致系統在更新期間無法服務。若要解決此問題並提升整體穩健性,下列哪項做法最適合?

(A) 調整生成模型的回應隨機性參數,以降低答案偏差並提升一致性;
(B) 提升檢索與索引的運算效能,以縮短查詢與更新所需時間;
(C) 採用索引的增量或分段更新方式,使新資料能即時納入而不需全部重建;
(D) 建立常見問題的標準答案集,透過快速檢索回應以降低模型負擔

看解答

正確答案是 (C) 採用索引的增量或分段更新方式,使新資料能即時納入而不需全部重建。

這題考察的是 檢索增強生成(RAG) 系統在維護與維運(LLMOps)中常見的挑戰:索引同步與系統可用性。

(C) 為正確答案:

增量更新(Incremental Update): 現代向量資料庫(Vector Database)支援增量索引,這意味著當有新文件加入時,系統只需針對新文件進行 Embedding(向量化)並插入索引中,而不需要對舊有的百萬筆資料重新運算。

解決過時問題: 增量更新能讓新知識快速上架,確保模型檢索到的是最新資訊。

確保可用性: 分段更新(Sharding/Segmenting)或藍綠部署(Blue-Green Deployment)可以讓系統在更新部分資料時,其他部分仍能正常提供查詢服務,避免「更新即停機」的窘境。

(A) 錯誤:

調整模型的「隨機性(Temperature)」只能改變說話的口吻或多樣性,無法解決底層檢索資料過時(Out-of-date)的問題。

(B) 錯誤:

「提升運算效能」雖然能縮短重建索引的時間,但屬於「治標不治本」的做法。只要架構上仍需「完整重建」,隨著資料量增大,更新成本依然會呈線性甚至指數級增長,且無法解決更新期間停機的問題。

(D) 錯誤:

建立標準答案集(FAQ/Cache)雖然能降低模型負擔,但無法處理「新知識」或「動態變化」的查詢需求,無法根本解決 RAG 系統索引重建與資料即時性的衝突。

RAG 系統優化策略對比

優化目標 建議作法 效果
資料即時性 增量索引 (Incremental Indexing) 新文件隨時加入,答案不跳票。
高可用性 分段索引與負載平衡 更新期間系統不中斷。
檢索精準度 重排序 (Re-ranking) 讓模型拿到更相關的上下文。
運算成本 向量量化 (Product Quantization) 減少向量儲存空間與計算開銷。

解題關鍵:當題目提到 「完整重建索引導致停機」 與 「資料過時」,在系統架構層面的最佳解法一定是 「增量 (Incremental)」 或 「局部 (Partial)」 更新機制。


39. 某醫院計畫開發住院日數預測模型,以協助病房調度。多數病人的住院日數集中在 3–7 天,但仍有少數重症患者因治療需求而住院日數明顯偏長。醫院希望採用一種合適的評估方式,既能兼顧大部分病人的預測準確度,也能確保對重症個案的預測維持穩健。下列哪一種方法最符合此需求?

(A) 在模型檢核時,同時呈現平均絕對誤差(MAE)與重症子群的誤差指標;
(B) 僅針對一般病人樣本進行交叉驗證,以避免重症個案拉高誤差;
(C) 將所有病人的住院日數進行標準化處理,以減少數值範圍差異的影響;
(D) 只採用單一的整體決定係數 (R²) 作為模型優劣的判斷依據

看解答

正確答案是 (A) 在模型檢核時,同時呈現平均絕對誤差(MAE)與重症子群的誤差指標。

這題考察的是在資料存在「離群值(Outliers)」或「長尾分佈(Long-tail Distribution)」時,如何進行科學且符合業務需求的模型評估。

(A) 為正確答案:
平均絕對誤差 (MAE): 相對於均方誤差(MSE),MAE 對極端值較不敏感,能更客觀地反映「大部分病人」的平均預測表現(3–7 天的族群)。
子群分析 (Subgroup Analysis): 醫院明確提到需要確保對「重症個案」預測的穩健性。單一指標往往會掩蓋特定族群的表現,因此「同時呈現重症子群的誤差」能幫助管理決策者了解模型在面對高風險個案時的可靠程度,這在醫療決策支援中至關重要。

(B) 錯誤:
樣本偏差: 僅針對一般病人驗證會導致模型對重症個案完全失去預測能力(欠擬合),這不符合醫院希望「確保重症個案預測穩健」的初衷,且會造成嚴重的評估偏誤。

(C) 錯誤:
意義喪失: 住院日數的「單位(天數)」在病房調度中具有直接的業務意義。雖然標準化能處理數值範圍,但它無法解決長尾分布對模型損失函數的影響,且標準化後的誤差指標(如 0.2 個標準差)對臨床人員來說極不直觀,難以用於決策。

(D) 錯誤:
指標局限性: 決定係數 (\(R^2\)) 是整體擬合度的衡量,在長尾分布下,極少數的極端值(住院 100 天被預測為 50 天)會對 \(R^2\) 產生巨大的負面影響,使其無法準確反映模型在「大多數病人(3–7 天)」身上的優異表現。

評估指標的選擇策略

指標 特性 適用場景
MAE 穩健(Robust),不受極端值過度干擾。 當你想知道「平均差幾天」且資料有長尾時 (本題)。
MSE / RMSE 對大誤差施加重罰。 當你非常不能容忍「預測大錯」時。
子群誤差 針對特定標籤(如重症、高齡)計算指標。 確保高風險或特定族群的公平性與精準度。

解題關鍵:在醫療或高風險決策中,「整體表現 (MAE)」 與 「關鍵子群表現 (Subgroup Metrics)」 的並行評估,是確保系統既準確又安全的最標準實務做法。


40. 關於監督式學習( Supervised Learning )與非監督式學習(Unsupervised Learning)的目標,下列敘述何者錯誤?
1.非監督式學習的核心在於發掘資料內在結構,例如分群、關聯規則與降維,而不依賴外部標籤。
2.監督式學習的典型應用為分類與迴歸,通常不適合應用於異常偵測任務。
3.非監督式學習若搭配少量標註資料,即會完全轉化為監督式學習。
4.監督式學習仰賴已標註的資料集,透過最小化輸出與真實標籤之間的差距,學習輸入與目標之間的對應函數。
5.所有監督式學習任務都必須要有大量完整標註資料,否則無法進行任何有效的模型訓練。
6.非監督式學習不需要目標變數,僅透過輸入資料本身的特徵分布進行模式學習。

(A) 3、5、6;
(B) 1、4、6;
(C) 2、4、6;
(D) 2、3、5

看解答

正確答案是 (D) 2、3、5。

這題考察的是監督式學習與非監督式學習的核心定義、特點以及它們之間的界線。我們來逐一分析各個選項:

選項分析
1. 正確: 非監督式學習確實不依賴外部標籤(Labels),主要目的是尋找資料的內在模式,如 分群 (Clustering)、降維 (Dimension Reduction)。

2. 錯誤: 監督式學習「可以」應用於異常偵測。例如,若我們擁有大量標註好的「正常」與「異常」樣本,就可以將其視為一個 二元分類問題。

3. 錯誤: 非監督式學習搭配「少量」標註資料時,通常被稱為 半監督式學習 (Semi-supervised Learning),而非「完全轉化」為監督式學習。它結合了兩者的優點,利用大量未標註資料學習分佈,再用少量標註資料來微調決策邊界。

4. 正確: 這是監督式學習的標準定義,透過損失函數(Loss Function)最小化預測與真實標籤的差距。

5. 錯誤: 並非所有任務都必須要有「大量」標註。例如 少樣本學習 (Few-shot Learning) 或利用 遷移學習 (Transfer Learning),即使在標註資料較少的情況下,也能訓練出有效的模型。

6. 正確: 非監督式學習不需要目標變數(Target Variable),純粹觀察資料點之間的相似性或統計分佈。


錯誤敘述總結 (為什麼選 D)
敘述 2 錯在: 監督式學習常用於「已知類型」的異常偵測(如詐騙行為分類)。

敘述 3 錯在: 這是「半監督式學習」的範疇,並非完全轉化。

敘述 4 錯在: 現代技術(如預訓練模型)已不再絕對依賴「大量」標註才能開始有效訓練。 

觀念比較表

特性 監督式學習 (Supervised) 非監督式學習 (Unsupervised)
資料要求 必須有輸入與 標籤 (Label) 僅需輸入資料,無標籤
主要目標 預測 (Prediction) 與 映射 (Mapping) 發現結構 (Structure) 與 模式 (Pattern)
典型任務 分類 (Classification)、迴歸 (Regression) 分群 (Clustering)、降維 (PCA)、關聯規則
評估方式 預測值與真實值的誤差 通常較主觀,需透過分佈或內聚性評估

解題關鍵:這類題目考的是「絕對性描述」。看到 「不適合應用於異常偵測 (敘述2)」、「完全轉化 (敘述3)」 或 「必須要有大量...否則無法進行任何訓練 (敘述5)」 這種過於武斷的說法,通常就是錯誤所在。


41. 一家旅遊平台希望建立模型,預測顧客下次是否會再次透過該平台訂房。資料包含:顧客 ID、年齡、旅遊次數、平均花費金額、主要交通方式(火車/飛機/自駕/公車)、會員等級(普通/進階/白金)、是否為海外旅遊等。下列哪一種特徵工程方法最適合處理「主要交通方式」欄位?

(A) 布林轉換(Boolean Conversion);
(B) 序數編碼(Ordinal Encoding);
(C) 數值標準化(Numerical Standardization);
(D) One-hot 編碼(One-hot Encoding)

看解答

正確答案是 (D) One-hot 編碼(One-hot Encoding)。

這題考察的是特徵工程中針對「類別型資料(Categorical Data)」的處理方式,關鍵在於區分資料是否具有順序性。

(D) 為正確答案:

名目資料(Nominal Data): 「主要交通方式」(火車、飛機、自駕、公車)屬於名目資料,各選項之間沒有高低、大小或先後順序之分。

One-hot 編碼邏輯: 這種方法會為每個類別建立一個獨立的欄位(例如:is_train, is_plane),並用 0 或 1 表示。這樣做可以避免模型誤以為類別之間有數值上的大小關係(例如:誤認「公車(4) > 火車(1)」),是處理無序類別資料最標準的做法。

(A) 錯誤:

布林轉換僅適用於「二元分類」(如:是否為海外旅遊,只有 是/否 兩種狀態)。交通方式有四種,無法直接轉為布林值。

(B) 錯誤:

序數編碼(Ordinal Encoding) 適用於有順序性的資料。例如題目中的「會員等級」(普通 < 進階 < 白金),這類資料適合轉為 1, 2, 3。若將交通方式轉為 1, 2, 3, 4,會誤導模型認為飛機比火車「大」,進而影響計算。

(C) 錯誤:

數值標準化(如 Z-score)是用於「數值型資料」(如年齡、花費金額),目的是將不同單位的數字縮放到相同範圍,不適用於文字類別的交通方式。

特徵工程:類別資料處理對照表

欄位範例 資料類型 建議處理方法 理由
是否海外旅遊 二元 (Binary) 布林轉換 / Label Encoding 僅兩類,非黑即白。
會員等級 序數 (Ordinal) 序數編碼 (Ordinal) 有等級高低之分。
交通方式 名目 (Nominal) One-hot 編碼 類別平等,無順序關係。
年齡 / 金額 連續數值 標準化 (Standardization) 消除單位差異。

解題關鍵:判斷類別資料時,先問自己:「這些選項有誰比誰大嗎?」

有(如:等級、尺寸):用 Ordinal Encoding。
沒有(如:顏色、交通工具):用 One-hot Encoding。


42. 一家跨國醫療研究機構希望利用各地醫院的病患資料,建立一個能夠預測疾病早期風險的機器學習模型。由於各國法規限制,病患的原始資料無法集中到單一伺服器。在此情境下,下列哪一種方法最能同時滿足「各醫院保留資料不外流」與「模型仍能跨院學習」的需求?

(A) 資料匿名化(Data Anonymization);
(B) 差分隱私(Differential Privacy);
(C) 聯邦學習(Federated Learning);
(D) 交叉驗證(Cross-validation)

看解答

正確答案是 (C) 聯邦學習(Federated Learning)。

這題考察的是如何在滿足**資料隱私與法規(如 GDPR)**的前提下,進行跨機構的協作建模。

(C) 為正確答案:

資料不落地: 聯邦學習的核心精神是「資料不動,模型動」。原始病患資料保留在各個醫院的本地伺服器中。

跨院學習: 各醫院在本地訓練模型後,僅將計算出的**「模型參數更新(Gradients/Weights)」**傳送至中央伺服器進行聚合(Aggregation),再將更新後的全球模型傳回各醫院。這樣模型能學到所有醫院的特徵,但完全不需要接觸到原始病患資料。

(A) 錯誤:

資料匿名化(如去識別化)雖然能降低風險,但「原始資料」仍需在不同實體間傳輸,且存在被「去匿名化攻擊」還原身分的風險,無法滿足題目中「資料無法集中」的物理限制。

(B) 錯誤:

差分隱私是一種在資料中加入「統計雜訊」以防止個人隱私洩漏的技術。它通常是聯邦學習中用來增強安全性的輔助技術,但它本身並不具備「跨院分散式建模」的架構。

(D) 錯誤:

交叉驗證(Cross-validation)是模型訓練中用來評估效能、防止過擬合的統計方法,與資料隱私或分散式架構無關。

隱私保護技術比較

技術 核心機制 資料是否需要集中?
傳統機器學習 所有資料匯總到雲端。
資料匿名化 移除姓名、ID 等敏感資訊。 是 (仍須傳輸)
聯邦學習 傳輸模型參數,不傳輸原始資料。 否 (資料原地留存)
差分隱私 在數據或梯度中加入數學雜訊。 視情況而定 (常用於保護統計結果)

解題關鍵:看到 「資料不外流/不落地」 且要 「協作建模」,標準答案就是 「聯邦學習 (Federated Learning)」。


43. 某公司欲建立員工離職風險預測模型,資料集中包含「年度績效分數」、「平均每月加班時數」、「年齡」等數值型特徵。由於各特徵的數值範圍差異極大(例如績效分數 1–5、加班時數 0–80、年齡 20–65),若直接輸入至使用梯度下降的邏輯迴歸(Logistic Regression)模型,可能導致模型收斂緩慢或權重偏斜。為提升模型訓練效率與準確度,下列哪一種特徵工程方法最適合應用於這些數值特徵?

(A) 布林轉換(Boolean Conversion);
(B) 時間序列分解(Time Series Decomposition);
(C) One-hot 編碼(One-hot Encoding);
(D) 數值標準化(Numerical Standardization)

看解答

正確答案是 (D) 數值標準化(Numerical Standardization)。

這題考察的是特徵工程中針對「數值型特徵」的預處理技術,特別是當演算法涉及 梯度下降(Gradient Descent) 或 距離計算 時的必要步驟。

(D) 為正確答案:

消除量綱影響: 題目中提到「績效分數(1–5)」與「加班時數(0–80)」範圍差異極大。若不處理,模型會認為數值較大的特徵(加班時數)更為重要,導致權重分配偏斜。

提升收斂速度: 對於邏輯迴歸這種使用梯度下降法的模型,如果特徵尺度不一,損失函數的等高線會呈現細長的橢圓形,導致梯度更新時在某些方向震盪,收斂非常緩慢。標準化(如 Z-score 或 Min-Max Scaling) 能將資料縮放到相似範圍,使損失函數趨於圓形,讓模型更快找到最佳解。

(A) 錯誤:

布林轉換是將資料轉為「真/偽(0/1)」。如果將績效分數或加班時數這種連續數值轉為布林值(例如:是否加班),會損失大量的細節資訊,不符合提升準確度的需求。

(B) 錯誤:

時間序列分解用於處理具備時間趨勢、季節性的資料(如股價、氣溫)。雖然資料中有加班時數,但題目並未提到這是一個連續的時間序列任務,且這無法解決數值範圍差異的問題。

(C) 錯誤:

One-hot 編碼用於處理「名目類別資料」(如部門、性別)。將數值特徵(如年齡)進行 One-hot 編碼(除非先進行分箱)會導致特徵空間變得極度稀疏,通常不直接用於連續數值。

為什麼「梯度下降」需要標準化?

特徵 原始範圍 梯度更新表現
績效分數 1 – 5 變動 1 單位代表 20% 的範圍變化。
加班時數 0 – 80 變動 1 單位僅代表 1.25% 的範圍變化。
影響 未處理前 模型會對「數值大的特徵」過於敏感。
處理後 標準化後 所有特徵在同一基準線上競爭,收斂快且穩定。

解題關鍵:當題目提到 「數值範圍差異大」 且使用 「邏輯迴歸」、「梯度下降」、「SVM」 或 「K-means」 時,標準答案幾乎一定是 「標準化 (Standardization)」 或 「歸一化 (Normalization)」。


44. 在機器學習中,「叢集(Clustering)」方法最典型的應用情境是下列何者?

(A) 根據歷史交易紀錄與已標註的詐欺案例,訓練模型來偵測未來的詐欺交易;
(B) 使用醫療數據與病患的診斷標籤,建立模型以預測病人是否罹患特定疾病;
(C) 根據顧客的消費行為與特徵,將顧客自動劃分為數個群組,以便進行差異化行銷;
(D) 透過大量已標註影像,訓練深度學習模型來辨識照片中的物件種類

看解答

正確答案是 (C) 根據顧客的消費行為與特徵,將顧客自動劃分為數個群組,以便進行差異化行銷。

這題考察的是 「叢集(Clustering)」 的基本定義與應用場景。叢集屬於 非監督式學習(Unsupervised Learning),其特點是在 沒有預先標註答案(Labels) 的情況下,根據資料本身的相似性進行分組。

(C) 為正確答案:

無標籤分組: 零售商通常不知道顧客屬於哪一種類型,但透過叢集演算法(如 K-means),可以將行為相似(例如:同樣愛買高單價商品、同樣在深夜購物)的顧客自動歸為一類。

典型應用: 這種「客群細分(Customer Segmentation)」是叢集分析在商務領域最經典的應用,目的是針對不同群體實施精準行銷。

(A) 錯誤:

監督式學習: 題目提到「已標註的詐欺案例」,這屬於 分類(Classification) 任務。模型是學習「正常」與「詐欺」之間的邊界,而非自行發掘結構。

(B) 錯誤:

監督式學習: 提到「診斷標籤」與「預測是否罹患疾病」,這也是典型的 二元分類 問題。

(D) 錯誤:

監督式學習: 使用「已標註影像」來辨識物件,屬於電腦視覺中的 影像分類(Image Classification) 或物件偵測,需要大量的標籤資料來訓練。

叢集(Clustering)vs. 分類(Classification)

特性 叢集 (Clustering) 分類 (Classification)
學習類型 非監督式學習 監督式學習
資料需求 不需要標籤 (Labels) 必須有標籤
核心目標 探索資料的內在結構與群體。 學習輸入與目標標籤的映射關係。
比喻 讓機器自己看這堆東西哪些「長得像」。 告訴機器這是「蘋果」,那是「梨子」。

解題關鍵:看到 「叢集 / 分群 (Clustering)」,請尋找 「自動劃分」、「分組」 且 「不提標籤」 的描述。常見關鍵字包含:客群細分、圖像分割、異常偵測(發掘邊緣點)。


45. 某醫院研究團隊蒐集了大量病患的「收縮壓」數據,經檢驗後顯示此數值大致呈現常態分布。在進行後續模型分析前,研究人員希望妥善處理可能存在的極端血壓數值。下列哪一種做法最為合適?

(A) 將所有極端偏高或偏低的血壓數據直接刪除,以保留最具代表性的病患樣本;
(B) 使用對數轉換(Log Transformation),將數據壓縮至更接近常態,以降低極端值的影響;
(C) 透過 Z 分數(Z-score)或標準差範圍檢測異常值,並依研究需求決定是否調整或移除;
(D) 將檢測到的離群值以 Label Encoding 編碼,轉換為序號標籤以避免影響原始分布

看解答

正確答案是 (C) 透過 Z 分數(Z-score)或標準差範圍檢測異常值,並依研究需求決定是否調整或移除。

這題考察的是在資料符合 常態分布(Normal Distribution) 的前提下,如何科學地處理離群值(Outliers)。

(C) 為正確答案:
Z 分數的適用性: 當資料呈現常態分布時,Z 分數(代表數值距離平均值幾個標準差)是檢測異常值的最佳工具。根據 68-95-99.7 法則,絕大多數資料會落在 \(\pm3\) 個標準差之內,超出此範圍的數值(如 \(Z > 3\) 或 \(Z < -3\))通常被視為離群值。
專業決策: 在醫療領域,極端血壓可能是儀器誤差(雜訊),也可能是病患真實的病理狀態(重症)。因此,不能盲目刪除,必須「依研究需求」決定是剔除、保留,或是進行蓋帽法(Winsorization)調整。

(A) 錯誤:盲目刪除的風險: 直接刪除極端值會造成資料偏差。在醫院研究中,極端血壓往往是研究「高風險病患」的關鍵資訊,隨意刪除會導致模型失去對重症個案的預測能力。

(B) 錯誤:對數轉換的對象: 對數轉換通常用於處理「偏態分佈(Skewed Distribution)」或具有「長尾」的資料(如所得、房價)。題目已明確指出數據「大致呈現常態分布」,此時使用對數轉換反而會破壞原有的常態結構,使其變得偏斜。

(D) 錯誤:邏輯錯誤: Label Encoding 用於處理「類別型資料」。血壓是「連續數值」,將單一數值轉為序號標籤會導致其喪失物理意義,且無法解決其對模型計算的影響。

常態分布下的離群值處理邏輯

步驟 說明
1. 識別 (Identify) 利用 Z-score 或 IQR (四分位距) 找出哪些數值異常。
2. 診斷 (Diagnose) 確認是錄入錯誤(如血壓 500)、設備故障,還是真實病理表現。
3. 處置 (Action) 錯誤值: 修正或刪除。
真實極端值: 保留(使用穩健模型)或蓋帽處理。

解題關鍵:看到關鍵字 「常態分布」,最直接相關的統計檢測就是 「Z 分數」 或 「標準差」。而在數據處理實務上,「依需求決定處置方式」 永遠比「直接刪除」或「強制轉換」更為嚴謹。


46. 某電商公司想預測用戶是否會購買特定商品,資料中包含多種用戶屬性與行為特徵。分析師希望選出對購買結果最有預測價值的特徵,以提升模型效能。下列哪一種描述最符合監督式特徵選擇(Supervised Feature Selection)的概念?

(A) 根據特徵的整體分布、變異度或資訊量進行篩選,而不直接參考目標變數;
(B) 評估每個特徵與目標變數之間的相關性,選擇對預測結果貢獻最大的特徵;
(C) 使用模型評估特徵對預測結果的重要性,並保留對目標變數影響較大的欄位;
(D) 將特徵透過降維方法(如 PCA)轉換為新特徵,再用於模型訓練

看解答

正確答案是 (B) 與 (C) 的概念皆屬於監督式特徵選擇,但在標準定義與實務分類中,(C) 涵蓋了更完整的監督式邏輯。

若需選出一個最符合「監督式特徵選擇」核心精神(即以模型目標為導向)的描述,通常會指向 (C),因為它強調了「模型評估」與「目標變數影響」的直接關係。

監督式特徵選擇(Supervised Feature Selection) 的核心在於:利用目標標籤(Label/Target)來判斷特徵的好壞。

(C) 為最符合描述:

模型導向: 監督式特徵選擇包含 Filter(過濾法)、Wrapper(封裝法)與 Embedded(嵌入法)。(C) 提到的「使用模型評估特徵重要性」(如隨機森林的 Feature Importance 或 Lasso 的係數縮減),是監督式學習中最直接且高效的特徵選擇方式。

目標明確: 它明確地依據特徵對「目標變數」的預測貢獻度來進行篩選。

(B) 亦正確(Filter Method):

評估特徵與目標變數的相關性(如 Pearson 相關係數、卡方檢定、互資訊量)也是監督式的一種,稱為「過濾法」。

(A) 錯誤(屬於「非監督式」):

「不參考目標變數」即是非監督式。例如移除變異數趨近於 0 的特徵(Constant Feature Removal),這種方法只看特徵本身的分布,不論它是否對預測購買有用。

(D) 錯誤(屬於「特徵萃取/降維」):

PCA(主成分分析) 是一種非監督式的降維技術。它會將原始特徵「混合、轉換」成新的主成分,而不是從原始特徵中「選出」有價值的欄位。

特徵選擇方法對照表

方法類型 常用技術 是否參考標籤 (Target) 目的
非監督式 變異數門檻 (Variance Threshold) 移除沒變化的無用資訊。
監督式 - Filter 相關係數、卡方檢定 快速篩選具統計相關性的特徵。
監督式 - Wrapper 遞迴特徵消除 (RFE) 透過反覆訓練找出最佳特徵組合。
監督式 - Embedded 隨機森林重要性、Lasso 模型訓練過程中自動完成選擇。

解題關鍵:區分「監督式」與「非監督式」特徵選擇的唯一標準就是:有沒有用到「目標變數(Target/Label)」來做決定。 只要選擇過程參考了「購買結果」,就是監督式。


47. 在訓練神經網路時,為了提升模型收斂速度與穩定性,避免梯度消失或梯度爆炸,下列哪一種做法最常被使用?

(A) 對輸入資料進行隨機旋轉或水平翻轉,以增加資料多樣性;
(B) 選用 ReLU 或其變體作為隱藏層的啟動函數,以改善梯度傳播;
(C) 減少樣本量提升訓練速度;
(D) 對目標變數或特徵進行標準化

看解答

正確答案是 (B) 選用 ReLU 或其變體作為隱藏層的啟動函數,以改善梯度傳播。

這題考察的是深度學習中解決 「梯度消失(Gradient Vanishing)」 與 「梯度爆炸(Gradient Exploding)」 的經典優化策略。

(B) 為正確答案:解決梯度消失: 傳統的啟動函數(如 Sigmoid 或 tanh)在輸入數值過大或過小時,導數會趨近於 0(飽和區),導致反向傳播時梯度逐層遞減,深層網路難以訓練。ReLU 的優勢: \(f(x) = \max(0, x)\)。在 \(x > 0\) 的區域,其導數恆為 1,這能確保梯度在多層傳播中不會衰減,極大地提升了模型收斂速度並解決了梯度消失問題。

(A) 錯誤:這屬於 資料增強(Data Augmentation)。主要目的是增加資料多樣性以防止「過擬合(Overfitting)」,並提升模型的泛化能力,但對於直接解決梯度傳播問題的效用有限。

(C) 錯誤:減少樣本量雖然能加快單次迭代的時間,但通常會導致模型無法學到完整分布,降低準確度,並非提升「模型穩定性」或解決「梯度問題」的正確方法。

(D) 雖然有幫助,但非首選答案:對特徵進行標準化(Standardization)能幫助梯度下降更平穩地收斂。然而,針對神經網路內部的「梯度消失/爆炸」問題,關鍵在於 啟動函數 (B)、權重初始化 (Initialization) 以及 批次正規化 (Batch Normalization)。在單選題的情境下,(B) 更直接對應題目所述的機制改善。

神經網路優化策略對比

常見問題 推薦解決方案 原理
梯度消失 ReLU / Leaky ReLU 保持正向區域梯度為 1,不進入飽和區。
梯度爆炸 梯度裁剪 (Gradient Clipping) 強制限制梯度的最大值。
收斂不穩定 批次正規化 (Batch Norm) 將每層輸出拉回均值 0、方差 1。
過擬合 Dropout / L2 正規化 減少模型對特定神經元的依賴。

解題關鍵:看到 「梯度消失」 與 「提升收斂速度」,標準答案組合通常是 「ReLU」、「Batch Normalization」 或 「ResNet (殘差連接)」。在本題選項中,(B) 是最核心的啟動函數優化手段。


48. 若希望檢視某一連續型數據的分布情形(如集中程度、偏態或是否呈現多峰),下列哪一種應用情境最適合使用直方圖(Histogram) 來進行分析?

(A) 探討顧客年齡資料的整體分布特徵,並檢視是否存在異常集中或分散現象;
(B) 比較不同商品在各月份的銷售額變化趨勢,以觀察季節性波動;
(C) 追蹤公司近一年營收的時間序列變化,以了解整體成長趨勢;
(D) 檢視產品價格與月銷售量之間的關聯性,以評估是否具線性相關

看解答

正確答案是 (A) 探討顧客年齡資料的整體分布特徵,並檢視是否存在異常集中或分散現象。

這題考察的是統計圖表的選擇與其對應的分析目標。直方圖(Histogram) 是探索性資料分析(EDA)中用來呈現「連續型變數」次數分配最常用的工具。

(A) 為正確答案:

呈現分布: 直方圖將數據切分成若干區間(Bins),透過長條高度顯示資料落入該區間的頻率。

觀察特徵: 它可以直觀地展現資料的 集中趨勢(均值、眾數)、偏態(資料往左或往右歪斜)以及 峰度(例如題目提到的多峰分布,可能暗示樣本中存在兩個不同的子群體)。這正是分析顧客年齡分布時的首選工具。

(B) 錯誤:

比較「各月份變化」屬於時間維度的比較,最適合使用 折線圖 (Line Chart) 或 堆疊長條圖 (Stacked Bar Chart),而非直方圖。

(C) 錯誤:

追蹤「時間序列變化」與「成長趨勢」,標準工具是 折線圖 (Line Chart),因為它能強調數據隨時間演進的連續性。

(D) 錯誤:

檢視「兩個變數之間的關聯性(如價格 vs 銷售量)」或評估「線性相關」,最適合使用 散佈圖 (Scatter Plot)。  

常見統計圖表應用指南

圖表類型 核心分析目標 範例
直方圖 (Histogram) 單一連續變數的分布、偏態、峰度 年齡分布、考試成績分佈
折線圖 (Line Chart) 時間序列趨勢、成長或波動 股價走勢、月營收變化
散佈圖 (Scatter Plot) 兩變數間的關聯、相關性、離群值 身高與體重、價格與需求量
圓餅圖 (Pie Chart) 組成比例、佔比關係 市場佔有率、支出預算比例
箱形圖 (Box Plot) 分位數、離群值、組間分布比較 不同地區的房價中位數比較

解題關鍵:看到 「分布」、「集中程度」、「偏態」、「多峰」 這些描述資料結構的關鍵字,在單一變數的情況下,優先選擇 直方圖 (Histogram)。


49. 下列何者並非我國數位發展部 AI 產品與評測中心在評估大型語言模型安全性時,所指出的常見使用指標?

(A) 資料複雜性;
(B) 事實正確性;
(C) 偏見與歧視;
(D) 惡意與濫用可能性

看解答

正確答案是 (A) 資料複雜性。

我國數位發展部(moda)轄下的「AI 產品與系統評測中心(AIPC)」針對大型語言模型(LLM)的評測,主要是參考國際趨勢(如 NIST AI RMF、歐盟 AI 法案)並結合台灣在地文化需求,擬定了 10 大評測項目。

(A) 非正確指標: 「資料複雜性」通常屬於模型開發過程中的資料特性描述,而非用於衡量模型輸出安全性或風險的「評測指標」。

(B) 事實正確性(Factual Accuracy): 這是評測中心的核心指標之一,主要測試模型是否會產生「幻覺(Hallucination)」或提供錯誤資訊。

(C) 偏見與歧視(Bias): 評測模型是否會對特定族群、性別、政治傾向等產生不公正或歧視性的言論,這屬於「公平性」範疇。

(D) 惡意與濫用可能性(Maliciousness): 包含測試模型是否會產出有害資訊、仇恨言論,或是否會被誘導進行不當用途(如撰寫釣魚郵件、製作非法物品指令),這屬於「安全性(Safety)」與「資安」範疇。 

補充:數發部 AI 評測 10 大項目

1. 安全性(是否輸出有害內容)
2. 可解釋性(模型決策是否可被理解)
3. 彈性(面對不同輸入的穩定性)
4. 公平性(是否包含偏見或歧視)
5. 準確性(事實正確性)
6. 透明性(模型來源與限制是否揭露)
7. 當責性(開發者的責任歸屬)
8. 可靠性(在異常狀況下是否維持功能)
9. 隱私(是否洩漏個人敏感資訊)
10. 資安(是否能防禦對抗性攻擊)

解題關鍵:這類安全性指標通常關注於「模型輸出的後果」與「對社會的衝擊」。「資料複雜性」 屬於技術層面的屬性,不直接作為評估模型安全風險的標準指標。


50. 某雲端服務公司計畫將大型語言模型部署於線上系統,並以批次推論(Batch Inference)方式處理每日上百萬筆用戶請求。專案團隊在評估可能遇到的挑戰時,下列哪一項通常不會被視為批次推論階段的主要難題?

(A) 如何確保訓練語料的涵蓋性與標註品質,以避免模型偏差影響輸出;
(B) 當批次規模增大時,如何降低推論延遲並保持即時回應能力;
(C) 在推論過程中,有效管理與分配龐大的輸入資料量以避免資源壅塞;
(D) 在叢集環境中精確安排推論任務,以提升 GPU/TPU 等硬體資源的利用率

看解答

正確答案是 (A) 如何確保訓練語料的涵蓋性與標註品質,以避免模型偏差影響輸出。

這題考察的是模型生命週期中 「訓練階段 (Training Phase)」 與 「推論階段 (Inference Phase)」 的區別。

(A) 為正確答案(非推論階段難題):

屬於訓練/開發階段: 語料的涵蓋性、標註品質以及模型偏差(Bias)的修正,都是在模型上線前的訓練與微調(Fine-tuning)階段需要解決的問題。一旦進入推論階段,模型權重已經固定,此時討論的是如何讓這個已經練好的模型「跑得快、跑得穩」。

(B) 屬於推論難題(延遲與吞吐量平衡):

批次推論(Batch Inference)雖然能提高整體吞吐量(Throughput),但較大的批次通常會增加單筆請求的 推論延遲(Latency)。如何在增大批次以節省成本的同時,不讓用戶等待過久,是系統架構師的首要挑戰。

(C) 屬於推論難題(資料管理與 I/O):

面對每日上百萬筆請求,資料的讀取(Input)、前處理與結果儲存(Output)會產生極大的 I/O 壓力。若分配不當,會導致記憶體溢位(OOM)或硬碟讀寫瓶頸。

(D) 屬於推論難題(硬體調度):

GPU/TPU 等運算資源昂貴。在叢集環境中,如何精確調度(Scheduling)任務,讓硬體維持在高利用率而不閒置,是批次處理系統(如 Spark 或 Kubernetes 上的推論任務)必須解決的效率問題。

訓練階段 vs. 推論階段 挑戰對照

階段 核心關注點 主要挑戰範例
訓練階段 模型品質與學習力 標註資料準確度 (A)、超參數調優、過擬合問題。
推論階段 執行效率與穩定性 硬體利用率 (D)、系統延遲 (B)、資源調度 (C)。

解題關鍵:題目問的是 「批次推論(Batch Inference)」。只要選項提到 「訓練」、「語料」 或 「標註」,通常都屬於上線前的準備工作,而非推論階段的維運難題。


回 AI 首頁   回 iPAS 首頁