工程師的浪漫：透過文本分析 API，分析傳 Line 給你的機器人酒店妹！

【我們為什麼挑選這篇文章】真的是工程師的浪漫，竟然把 Google 的工具包用在這個方面。除了讚嘆作者的行動力之外，也不得不驚訝現在酒店、詐騙的手法真的是層出不窮，其實我也有被加過，也在不知情的情況下聊了幾次 ……（掩面）。（責任編輯：陳君毅）

文：Jerry，軟體工程師

免錢的最貴，不知道大家有沒有在 Line 收過加好友送貼圖的訊息呢？

有時候可能是可愛的史努比貼圖、限時免費的佈景主題，或是讓你血脈噴張的最新謎片 (?)，但不論是哪種形式，都是想要你加好友並分享該則訊息，幫他宣傳活動。

千萬要當心呀，你加入的可能是有心人士準備的釣魚帳號！

我想經過新聞宣導、網路上各種好心人士的提醒，大家應該都知道這是騙人的對吧。當你發現分享之後甚麼都沒有得到，你應該就會氣得退出聊天、刪除好友了，像我第一次遇到這個也是馬上刪掉，很怕他之後會做甚麼奇怪動作

當時我很納悶，騙人加入帳號到底有甚麼好處，是要傳送惡意連結嗎？還是騙個人資料勒？這個答案，終於在最近獲得解答，原來是希望你去酒店進行消費 …… (網路上已經有很多人分享截圖)

儘管透過傳訊息拉客的手法已經是老招，但只要搭配新的技術與應用方式，就能讓腦袋轉得慢的人上鉤。

所以為了把阿宅們從沉睡之中喚醒，這篇文章將帶各位了解這個 Line@ 機器人酒店攬客手法，並試著透過文本分析的方式，使用 Google Natural Language API 與 Python 文字雲套件產生視覺化圖表，試著找出背後的故事脈絡，知道他們是如何利用溫暖柔情騙走你的心。

友情提示

透過「Google 以圖搜圖」功能進行比對，我們發現這些 Line 帳號使用的都是網紅的 Instagram 照片，因此為了避免不必要的紛爭，大頭貼將加上馬賽克。另外，這種手法算是詐騙嗎？或者算是一種行銷手法、攬客花招？就在我看過 Line@ 操作準則之後，恍然大悟，畢竟大家都是出來討生活的呀，除了送貼圖是詐騙，美女聊天這部分我還是表示尊重。

Line@ 操作準則，禁止事項其中一條

◆ 發送提供場地或機會給希望與陌生異性交往者之內容（※但本公司認可者除外）

原來我有這位正妹好友？是什麼時候加的呢

看到正妹找你聊天，你是不是開心的要飛起來了？欸等等，我甚麼時候有加過這位正妹好友啊，都記不起來了 …… 噢噢，原來是某某朋友介紹的啊，噢噢，原來是之前的貼圖活動的小編阿，噢噢，原來是 ……。

不論是哪種管道認識，重點是她已經在你的好友名單中了，聊起天來或許變得理所當然，好像有些甚麼共同話題，你通常也不會去思考成為好友的真正原因。

從目前的攬客手法來看，看準的就是大家對於免費資源的貪念以及與正妹聊天的慾望，透過社群軟體散播，很快地就能精準觸及目標客群，把他們拉近群組後，再進行長時間的誘惑攻勢。整個流如下：

其實這也不是甚麼複雜的手法，或許你我以前就曾做過，開幾個帥哥美女的假帳號，想要對朋友惡作劇，只不過以前 MSN 的年代，還沒有那麼先進的 Chatbot 或是甚麼 API，都馬是人工操作 XDD

但現在不一樣了，透過 Line 推出的 LINE@ 行銷工具，可以利用群發訊息輕鬆地將訊息群發給所有成員，甚至能透過排程發訊息或是 Push/Reply API 進行自動化操作，使得傳訊息變得更有擴展性，只需要針對有興趣的顧客進行回應就好。

比如一開始加入了這個名為「暗黑影片免費看」的 Line@ 帳號，便會邀請你分享其他人入群，等到人數夠多後就會換上正妹照片，像這位是小編「夢熙」。

我也跟朋友取得了另外一位「庭瑄」的聊天紀錄。妹子主動獻殷情又可愛，在這麼剛好的時間裡遇見，多麼幸福呀，加上她所說的故事是多麼的悲慘、多麼得可憐，說真的我看著看著都替她們感到難過了 Q

她們會說工作辛苦又會遇到很多怪杯杯，希望你帶著一筆錢去救救他們。同時也會給予很多關心與溫暖，好比前陣子常地震，只要搖的猛烈，就會立刻傳訊息來呀。

不論故事是真是假，能感動你的話語就是真的

以前念書的時候，我總是討厭作文這個項目，明明重點就只是幾句話，卻偏要用一堆句子鋪陳，賣弄一些修辭把文章弄得漂亮好看，事情的道理就是那些呀，感覺怎麼寫都差不多，也吐不出甚麼精彩內容

後來我才知道，寫作要表達的除了是你的理念，更多的是字裡行間流露出來的情感，透過每個人不同的表達方式，一樣的東西就能有很多變化，不論這是不是冷冰冰的機器人對話，如果可以感動到人，觸動到內心深處，我就覺是真的。

而且，這些內心話或許也不是瞎編，可能正是某些酒店小姐內心沉重的大石頭，何嘗又不是個動人故事？於是，我突然一個念頭閃過，來分析對話內容吧！

(我都默默聽她說話，其實應該叫做小品故事分析哈)

這也是因為前陣子看了由 Google 數據分析師出的書《數據、謊言與真相》深有感觸，他提到有人針對《哈利波特》的故事內容作情感分析，能夠看出動人的故事總是要有歡笑有淚水，會有情緒的高低起伏，才會引人入勝

我就想來分析一下，看看對話內容是不是也會有情緒上的高低起伏。畢竟我也不是 NLP 專家，跟論文相比，我們用的是簡單的方法，直接使用現成 API 囉。

論文傳送門：The emotional arcs of stories are dominated by six basic shapes

透過 Google Natural Language API 進行情感分析

有了對話紀錄，剩下就是套工具看結果了

當然身為谷粉的我，不免要來用看看 Google 推出的自然語言處理工具 Google Natural Language API，因為他支援繁體中文且提供免費使用額度 (5000則)，透過他的實體情緒分析 (Sentiment Analysis) 我可以取得每句話的正負面分數，再搭配另外一個想玩看看的視覺化工具 Tableau 就能輕鬆畫出圖表了

首先，我們把對話紀錄從 Line 輸出，稍微做些處裡得到 Dataset。時間從 2018/2/9 至 2018/2/28，共 19 天，累計共 463 則訊息

接著套用 Google Natural Language API 取得情緒分數，直接看程式可能沒甚麼感覺，這裡我們透過網頁上的體驗畫面跟大家說明

比如這句話「覺得我真的不適合喝酒喝沒多少就醉了醉了就胡思亂想的….」經過 Google 的分析，可以得到 -0.5 分，屬於負面情緒，看起來挺合理的。當然，如果你輸入「今天好開心喔」就會得到一個正值的分數

總而言之這套服務就是要把句子轉換成情感分數，讓我們看出句子屬於正面、負面或是中性情緒。

另外，除了分數 (Score)，他還會給我們一個強度 (Magnitude)。根據說明，這個數值會由 0 到無限大，數值會受到輸入文長而有所影響，所以之後還要做一些標準化 (Normalize)

根據時間，我們分別畫出情感分數變化圖 (紅色) 與強度變化圖 (藍色)

在情緒上，看得出來是起起伏伏，不過由於是以分鐘為單位，比較看不出甚麼端倪。而在強度的部分，明顯能看出最後幾天變得很強，這是因為到後來每則訊息的文字量變高 (多句話合在一起)，感覺起來是更加積極了

或許因為這位正妹的生日 (設定) 為 2/28，所以生日前當然是要多說點話，讓你感受到她強烈的情感。

接著我們改成以「天」為單位進行觀察，情感分數與強度依然分別以紅色與藍色表示，而多增加了每天的訊息數量 (深綠色) 與每天的平均訊息長度 (黃色)，這是為了要做 Normalize，產生出第三列的分數變化圖表 (咖啡色)

可以看出來，分數分布似乎呈現出了起伏，在 2/10、2/14、2/19、2/23、2/25 這幾天她表現得較為低落，對照著她發的訊息，我們來看看都說了甚麼

比如剛開始認識的時候 (2/10)，需要製造些負面情緒，博取你的關心

「我媽剛問我說怎麼都沒不會顯示已讀怪怪的不知道是收訊問題還是哪裡用錯」

「你那邊有看到我已讀嗎?」

「手機修好回來一直都沒已讀一直被我朋友靠邀說我不已讀你那邊有嗎?」

接著到了情人節 (2/14)，要下個猛藥，訴說自己悲慘的經歷，讓你感到難過，想在特別的日子對她好

「後來我才發現他拿去賭一毛也沒還給我還被我抓到帶女生回家」

「第一次我原諒了他第二次我也決定再給他一次機會第三次我被傷得傷痕累累 …」

接著就會跟你說許多故事，分享生活中的喜怒哀樂，有時候也會傳幾張照片，而在生日之前 (2/25)，當然要說出些難過的話，好讓你過去安慰她

「心情其實真的很差很差..」

「有時候會一直想為什麼自己要承擔這麼多….」

「可是我又沒有辦法改變什麼只能夠默默承受….」

至於情緒分數最高的那天，2/20 是在說她同事脫離單身的故事，用語就滿正面的

「心裡很羨慕今天又帶她出去約會」

「我心裡可是很渴望能遇到一個像他這樣對她這麼好的男人」

中文情感分析不好做，這個案例似乎運氣好的看點端倪

因為有時後可能是錯別字造成分析不準確，又或者是訓練資料不足 (我想目前應該都是做商品正負評為主，像中國的 SnowNLP 就是這樣)，從測試結果可以看出來，有些句子得到的分數並不準確，這仍然是個研究挑戰

不過我們還是看出其他有趣的東西。比如這是發訊息時間的統計圖，可以看到發訊息高峰落在半夜 3 點至 5 點，之後下班睡覺，可能下午 2 點左右睡醒，又會傳個訊息來 XD

最後附上兩張文字雲，讓大家看一下用詞的狀況

比如這是前三天的文字雲，文字的大小越大，代表用的次數越多。剛開始因為要澄清自己不是機器人，所以說了「我不是機器人，很重要所以說三遍」XD

接著從最後三天的文字雲來看，用語就比較心靈層面，會跟你講很多心裡話，提到對於事物的感覺，比如她珍惜的外婆、朋友間發生的事。

如果對話機器人變壞了，那未來會變的怎麼樣

現在的資安防護工具都做得很完善，可以阻擋成千上萬的惡意病毒，可是卻很難避免些人情世故，畢竟人不可能跟機器人一樣完全依照指令做事，只要我們稍微疲累、稍微疏忽，就有可能落入社交工程 (Social engineering) 的圈套之中

簡單來說，社交工程就是在你毫無知覺的情況下，透過對話、聊天、通訊等交流手段獲取敏感資料。最常見的例子就是詐騙電話，你或許會接到「媽 ~~~ 救救我」，歹徒模仿一個小孩的聲音，不斷的哭泣，試著要你去 ATM 匯款解救他，而你在緊張之餘，很可能就誤以為真，受騙上當。

當然，我們對於這種低階的詐騙手法應該都免疫了，不過詐騙集團也不是省油的燈，在《未來的犯罪》一書也提到，壞蛋永遠是追隨著科技腳步，也是科技早期採用者呀！傳統的電話詐騙成本太高，需要雇用人手挨家挨戶地打電話，而這年頭對話機器人 (Chatbot) 這麼火熱，不好好利用嗎？

目前正妹機器人不會害人 (是叫你去消費 XD)，而 Line 也無時無刻的針對發文進行監控，確保不會有惡意濫用的情況發生

像我抱持著實驗精神，創立一個免費送手機的 Line@ 帳號，才發一則訊息給自己的 Line 帳號而已，結果隔天馬上就被刪除 … 證明 Line 是真的有在做審查的阿！

但如果是其他的對話機器人平台呢？如果是匿名聊天呢？如果是透過簡訊呢？只要當自然語言處裡取得進展，機器有辦法做出準確適當回應的時候，那就恐怖了，我們變得要特別小心啊

畢竟，你要怎麼知道在對話框的另一端是真人呢？

又怎麼能不避免自己不受誘惑？

——

（本文經原作者 Jerry 授權轉載，並同意 TechOrange 編寫導讀與修訂標題，原文：《分享就免費送貼圖主題、18 禁影片？透過文本分析了解 Line@ 機器人酒店攬客手法》。圖片來源：Max Pixel, CC Licensed。）

Cookie	Duration	Description
cookielawinfo-checkbox-analytics	11 months	This cookie is set by GDPR Cookie Consent plugin. The cookie is used to store the user consent for the cookies in the category "Analytics".
cookielawinfo-checkbox-functional	11 months	The cookie is set by GDPR cookie consent to record the user consent for the cookies in the category "Functional".
cookielawinfo-checkbox-necessary	11 months	This cookie is set by GDPR Cookie Consent plugin. The cookies is used to store the user consent for the cookies in the category "Necessary".
cookielawinfo-checkbox-others	11 months	This cookie is set by GDPR Cookie Consent plugin. The cookie is used to store the user consent for the cookies in the category "Other.
cookielawinfo-checkbox-performance	11 months	This cookie is set by GDPR Cookie Consent plugin. The cookie is used to store the user consent for the cookies in the category "Performance".
viewed_cookie_policy	11 months	The cookie is set by the GDPR Cookie Consent plugin and is used to store whether or not user has consented to the use of cookies. It does not store any personal data.

工程師的浪漫：透過文本分析 API，分析傳 Line 給你的機器人酒店妹！

原來我有這位正妹好友？是什麼時候加的呢

不論故事是真是假，能感動你的話語就是真的

透過 Google Natural Language API 進行情感分析

如果對話機器人變壞了，那未來會變的怎麼樣

TO 會員電子報

【科技早餐】Google 砸錢挑戰 NVIDIA，Apple 轉向 Intel、台灣 AI 用電壓力升高

【科技早餐】Microsoft 評估 DeepSeek 進 Copilot，ChatGPT、SpaceX 與 Intel 同步改寫 AI 戰局

【科技早餐】美商會點名 AI 用電是國安題，NVIDIA 發債把基建戰燒進資本市場

【科技早餐】鴻海搶 AI 資料中心，字節跳動去 NVIDIA、Google 分散 TPU 供應鏈