其實有看到一些資訊想要來這邊,也想要讓唐政委知道,看看有沒有辦法做一些改變,讓我們的視障的政策更符合視障者的一些想法與要求。
主要是因為我們最近看到您有在推Open API,希望政府能夠在契約範本有這樣子的示範,讓投標廠商遵守的這件事。我們希望有無障礙,也就是在政府開發的一些資訊系統上也能夠有類似的,就是說也能夠致力要求這一些廠商做一些改善,也就是廠商剛開始開發的時候有一些比較好的設計,比較不會有現在的一些狀況。
我大概講一下,無障礙網頁這一塊做得比較完整,也很早期就有推,整個流程大概是如果一個網頁做完之後,就會去跟現在的主管機關申請……
……知道,跑去測試。
對,它有一個軟體測試。跑完之後就會進行自我檢測的list確認,如果都檢測完之後就會跟NCC申請標章,然後NCC就會依據他們的資料發給他們,等級有三種。
現在主要的問題是,我們之前有先開會,也有提到說check list的部分,因為要打勾,其實他們也很難檢測,所以都直接勾,他們勾了之後,我們視障者去使用還是有問題發生。所以現在NCC有一部分是做抽檢,像今年是兩百五十個,他們會抽網站,讓視障者檢測,就會有檢測報告,透過軟協那邊的一個案子,就會發給視障者檢測或回應。
這一段的過程是,因為我們是覺得在自我檢測的部分,我們希望能夠做得比較落實,不是打勾,因為拿到那一張表我們是承辦人或是管這一個網頁的人,比較難認定,也就是比較不好判斷,因為沒有一些工具的話,其實跟我們視障者在使用的時候,其實狀況是差很多的,我如果是承辦人,我也一頭霧水,不知道是不是有問題。
我們現在有一個想法,他們在做自我檢測或是廠商在開發之前,他們先用一些程式,因為現在國際上有一套NVDA,這套程式是Open Source的,我們希望廠商或是這些承辦人在送件之前要先用這個程式去操作,看到底會不會遇到一些狀況,這樣才會比較落實這些自我檢測的部分。
他們現在主要的做法是,因為NCC有整理出一些條文,會告訴你說要怎麼寫這一個網頁,這樣就會讓視障者可以閱讀,其實那一個條文最後反應出來還是要讓視障者能夠使用,在網頁比較不會這樣,按照那個寫應該不會有太大的問題,但是像JavaScript,如果今天不是一個網頁,而是一個應用程式的話,這個做法很難往下推行下去,所以我們認為真正拿一個國際上的Open Source來直接實測,看會不會遇到一些障礙,這樣的方式在自我檢測做,會有比較好的效果。這是我的想法,不知道你有什麼想法?
我先分享一下,因為我不是NCC的督導政委,我其實唯一能做的事情是,因為我之前也開發過,我們在美國叫做Section 508的技術。我以前是Socialtext公司Section 508的主要設計負責人,我們那一套軟體,誠如您說的是非常多JavaScript,所以其實機器看起來是可以看的,但是事實上我當時並不是用NVDA,而是用JAWS,跟另外一個screen reading的程式去測——兩個都是Windows上專用的——但是確實我必須要蒙著眼睛自己操作一遍,才確定它是可以使用,而不是只靠機器檢核,這兩個中間的差距我滿瞭解的,這是一件事。
另外一個是您剛剛提到的「抽檢」,這個「抽檢」都是盲人朋友自己在幫軟協?
NCC有發一個案子,應該是委託軟協承包,承包之後他們會挑兩百五十個,就會給一個form,可能是抽十至十五個連結,然後給你之後,你就按所給的連結做測試。
我想詢問的是,這是在他上線前或是上線後?
上線後,就是標章已經拿到了,這是抽檢的意思。
其實主要的訴求可以拆成兩個部分,一個部分是希望拿到標章之前的前測可以多一些?
對,希望不是直接打勾。
另外一部分的訴求是,不只是發包給盲人朋友們,應該承辦自己也有像我自己閉著眼睛測的訓練?
我們希望推廣到承辦或是廠商開發者,因為其實在先期開發,如果你先試過,這樣做起來無障礙成本也會低很多。像我在開發一些網站的話,他們要用一些元件或者是其他JavaScript的一些東西,我就會先幫他們測,看看使用上會不會有什麼問題,當然整個完成還是要再測,但前面測過以後,其實後面的成本就不會那麼高,出現無法使用的情形就會少很多,如果可以多推廣一些,當然是承辦人一定要會的,推廣到一些民間或比方政府承包案子,如果我們能開一些認證課程或什麼的,讓這一些民間的開發者或承辦人員有這個能力,以後政府有標案的時候,比如有受六小時的訓練有加分。
我們說驗收人員不只是概念上知道——我想大家現在都知道概念很重要——而是要第一手聽那個東西的經驗?
對。
好。
具體來講,如果你們現在有給一個教材或給一些訓練課程,不管是線上錄影好的課程,或是實際去教學,你們現在有這種教程嗎?像我們在推開放資料或是推其他「開放政府」的時候,我們可能有錄六小時或者是八小時的教程,我們會希望用翻轉教室的方式,就是這一些承辦人員先看過這一些——可能也可以算終身學習時數——之後有問題再來問我們,來問我們的時候,我們就可以按照實例跟他們說,這個實例跟影片裡有什麼不一樣,我們再來討論實例。不知道你們是不是有這樣子的?
民間有很多協會都有在教學,只是沒有整理那麼完整有一個影片跟整個課程,很完整給一般民眾看,現在還沒有。
是一般的廠商或承辦。
對,現在還沒有這樣的課程。民間也有一些團體在教一些視障者或是一些家長的。
王博士那邊有。
唐政委,我這邊稍微補充一下。
請說。
其實臺灣數位有聲書推展學會過去已經辦過十一年的職業訓練,主要是針對身心障礙者,最主要大部分是視障者,其中一個課程主要是讓他們知道如何檢測無障礙網頁,不過坦白說我們的確還沒有做成像你這樣講的教材,可以自己study。
我現在看到的問題,自過去十幾年,我從2003年開始推國內無障礙網頁就有參與,改版的時候就改成WCAG 2.0,我也是被邀請那五個專家去參與制訂,所以對整個是瞭解的。
現在最主要的問題應該是,就教育方面,我們製作網頁設計者在大學教育裡面並沒有接觸這方面,他們唯一的是,以後遇到在政府單位或是民間若要做網頁,才開始接觸到無障礙網頁,所以他們不瞭解,常常他們是以視覺的方式去設計這一個網站,他不知道screen reader的運作機制是什麼,他們感覺上看不出有什麼問題。
等到這個出來再去矯正,就像無障礙空間,等到building都蓋好,再去蓋實體的無障礙,會耗很多的力氣。所以如果可以的話,從教育的階段,讓網頁設計者切入這一種網頁設計的概念,這是最好的。
事實上國內已經有一本書了,我現在講的是還沒有人把它製作成數位化的教材,以便可以用遠距學習,即使現在都還沒有,但這是很好的idea,這樣大家會比較省時間;很可惜的是,那一本一直還沒有被排入一些大學或網頁設計者。
我有一個朋友,我們大概認識十幾年的朋友,林克寰 (Jedi)。
我們是講同一個人,他就是其中的一個,這本書就是他寫的。
是「無障礙網頁親和力(Accessibility)」,那一本對我在矽谷的工作也非常有幫助,所以我們應該是同樣的脈絡(笑)。
是,沒錯。我前幾天還又跟他通過電話,有談到這個問題。
因為他是聽力師,他對實際的需求非常理解。
我想先回應一下,在行政院體系裡面,如同剛才您說的,我們在採購上開始引入一些所謂Open API的想法,這個想法有一點像是我們按圖施工的東西,在以前網頁的前端跟後端是綁在一起開發的,我們現在希望網頁的後端發包,但是前端分別發包,中間是透過API來串接,這一件事就扣合到老師剛才講的,從這個角度來看,即使前端對視障者不友善,只要我們保證前端的資訊全部都是用API給他,並不是自己去資料庫或別的資料來源取得,我們做一個專門給聽覺的網站,其實是非常容易的,因為理論上所能夠呈現及能夠輸入的資料,都在API的宣告裡面。
我現在的想法是,當然WCAG的這個很重要,因為畢竟還是有人有來寫對聽障、視障者友善的親和力網站,但是某個程度來看,可以把一開始前端的責任稍微分到可能比較專門做親和力網站的朋友,等於一個網站可以很容易有用VR的版本,或者是用互動式機器人的版本,或者是用親和力的版本,我覺得這一個教學是可以融合在Open API這一個想法裡面去的。
誠如我剛才跟老師反映的,如果有我們能夠排進終身學習自我學習的時數,我們在實作上比較容易做,這個概念我完全同意、這個精神我完全同意。
有一個很重要的是,我的想法是初期讓他們有這個概念,這樣來做的話,效果會比較好,不會像現在是檢測端,因此到最後端才要改變它。
網頁可以分前、後端的概念,可以透過API介接起來,有一些除了推網頁之外,要推應用系統或Windows上的視窗介面,比較沒有辦法像有一個Source code怎麼寫出來的,所以我們還是希望能夠使用screen reader,瞭解如何簡易操作的話,除了用在網頁的界面上,比較像用在應用程式或手機的部分,這樣的概念範圍會比較廣,以後政府如果在推其他的,因我們希望不是對外網站,像因為我也認識很多在公務體系工作的員工,他們其實也是視障者,有時內部網站沒有這樣的硬性要求,如果在發包的時候沒有規定一定要這樣做,在事後也很難要求,就會說改動的幅度是多少,可能也會吃到一些真正需求要改變的幅度,所以如果我們在政府委外或自己開發出來的系統有這樣的要求,廠商就比較需要遵守。
這就像美國「508法案」就有這樣的要求。這個是國發會的,國發會好像是你主管的?
資管處是我協助,這確實是資管處的業務(笑),就是我管的。
就是在發包的階段就define說政府採購需要能夠符合這方面的要求。
好,這個我可以詢問資管處的同仁。
我的理解是,就如同推「開放政府」的概念是一樣,推概念是一回事、推格式是一回事,推一個解決方式是另外一回事。應該要開放格式,大家都開得了,這一件事大家都接受的,ODT這個格式可能接受的人變成七、八成,反正Word也開得了,可是如果要推LibreOffice,接受的人就掉到一半,技術越特定,越難滿足所有人的需求。我們從概念端來推,不管是推Open API或者所謂雲端的web-based系統,這個概念大家都同意,因為不需要自己從頭建置很古老的應用程式架構,不同廠牌的手機,可能三個主要的系統都可以跑得到HTML,所以其實建置一個App,可以三個系統都跑,不用特別學不同的程式語言等等,因此我們推這一個概念是很容易推的。
但是推到實際的格式,比如一定要符合WCAG,或者是哪一個檢測的項目,會發現技術其實領先這一個標準的狀況,我們以前做508的時候也碰到一個狀況,有些在ARIA裡面沒有規範到,因為它太新了,是HTML5的技術,所以我們還是要自己測試實際的使用者到底用哪一版的閱讀器,如果用舊版的閱讀器,根本認不得,即使我們有做,這個工作就變得比較累;如果我們又要綁到特定的閱讀器,這個就又更累。
所以我的意思是,我們前端的概念跟格式標準的工作,這個是我責無旁貸,我一定會做,但是具體要用哪一個技術做先期驗收,這個我要跟資管處的朋友討論。
因此我認為不一定強調要用特定的screen reader,雖然其實到最後他們會用NVDA,因為它是free,其他的軟體像JAWS太貴了,一套要1,000多美金,NVDA的開發者我也都認識,他也告訴過我還滿多明眼人都拿NVDA來測accessibility,因為不用錢啊!對他來講不用花錢。
是啊!
可以再討論,看市場的狀況怎麼樣,概念性的部分就是還是要實際用工具與screen reader去操作。剛剛也有講到技術領先的這一件事,我們也很有感覺,像有時會拿一些IE,可能8或9,有一些使用者就打8或9在用,然後就說這個好像沒有無障礙,有一點卡卡或什麼問題,就是跟NVDA搭配,其實舊版的東西就是認不得這些東西,就會造成好像不是無障礙,可能就要用其他的軟體去使用,因此我們才想說還是要用實體的程式來做,這樣會比較理想。
其實做無障礙雖然有成本,但是絕對沒有支援IE8的成本高(笑)。
就像奕勳提到的,檢測方面主要國內有一些人不瞭解,其實在WCAG 2.0, 先前研考會已將check list做好了,如果設計者有些項目不瞭解,他們可能會有一個心態,就先打勾,反正若檢測人員發現哪裡有問題就改哪裡,比較是被動的心態。因此,那時我們開會曾討論到是不是可以設計一個機制,讓這一個單位的主管要把網頁推出去的時候,能認知到要真正達到無障礙是他的責任,而不是說,只要做完,等你們告訴我哪裡要改,就改哪裡給你,這會花費太多的社會成本,不管是公部門或者是民間會花太多的成本,所以是不是有一種機制是可以儘量讓參與設計者,一開始他們就有這一個概念,等到再勾這個Check List 時,就不會閉著眼睛一直勾。
另外一個比較好的想法是,如果一開始建置系統的時候,那個系統的基底就像建築工法的底層,已經通過508檢測的軟體,好比像Drupal是一個很好的例子,或者是WordPress的一些視覺主題是已經設計給508用的,或者是我們自己在用的Discourse,這一些東西其實都是開放源碼,都是已經經過不知道多少次滲透測試,也包含508的東西,如果只是在上面換皮膚、CSS,而不引入新的模板的話,其實就不用再測了,那一定是可以用的。
這對於廠商來講,我們就比較不是以親和力的角度來跟他們說,而是說可以減少重複開發的成本,這是我們目前有在推的;也不瞞各位說,後面有一件事是,這個廠商的不可取代性就比較少了,如果明年沒有拿到合約的話,下一個廠商也可以繼續維護(笑)。
就無法綁標。
對,就很難綁標,當然我相信在場不會有人覺得綁標是一件對的事(笑),但是我們在推的時候,也只能比較按照實際推得到的地方推,我先跟大家講,這個方向是對的。
就像堆積木,而有一些積木已經通過一些測試的概念。
像我們有一些單位在做的時候,問題是一樣的,用的東西他們知道,所以我們在開標的時候也是,就像你剛剛講的那個問題。前面這部分我們想要表達的是,無障礙跟政府機關一些資訊系統的部分。
還有一個部分是教育體系的部分,我先講一下現況,比較早期的時候,因為以前沒有電腦,所以是用點字的方式閱讀,字也是用點字做的,後來進到電腦的時候,大概的方式還是用一些電子點字,我先講一下中文點字的概念是用注音符號,英文是這樣子,因為英文沒有一個字詞,中文的部分有ㄅㄆㄇㄈ,所以點字的時候「ㄅ」是代表某幾個點,視障者去摸,然後去拼出來那一個字的意思是什麼,像中文有很多同音義字的狀況,因此如果只學點字的方式,很難瞭解那個到底是哪一個字,這樣對他們的影響是很大的。
主要的重點是,因為以前都是用這一種方式學習,所以教育部提供的一些教材常常是給他點字檔或是電子點字檔,那個東西只有告訴你ㄅㄆㄇㄈ,然後你就要自己去拼,視障者在學習的時候,比如讀到「程式」,到底是台北市的城市或者是指程式設計,這樣就沒有辦法瞭解,如果他今天去查資料,如果只有電子點字檔的方式,就很難查到正確的字,要在網路上查訊息的時候,就會有問題……
……新注音選到什麼就是什麼。
對,這個其實影響非常大的,他們很難搜尋到正確的資訊。其實王博士也有在推「認國字」,然後能夠正確打出字的部分,只是因為現在很多教材是提供電子點字的方式,因此視障者在學習的時候遇到很多的狀況,無法瞭解這一些概念。
視障團體希望能夠有原本的電子檔來使用,這樣就可以,電子檔出來之後,經過screen reader的點字表後就會轉換成點字。
如果是EPub 3,拿到手中上直接變成點字,沒有差?
對,但他們很多不願意提供,像教育部或書商,因為他們的概念是,一般人看不懂電子點字,只有視障者看得懂,所以覺得比較沒有什麼問題。我們想要要求他們提供這一種電子格式,他們比較不能接受,或者是常常不太願意提供這一些資料。
我再稍微補充一下,著作權法已經修法過了,基本上這個還是在過度階段,可能因為有一些某種原因,也許牽涉到一些conflict of interest的問題,即使政策有一些有訂了,但是在執行上會有一些偏差。最主要是因為早期沒有電腦,所有世界的盲人都從六點braille 開始學習點字,各個國家有不同的braille 系統去代表自己的語言。
臺灣是在民國初年的時候是用ㄅㄆㄇㄈ來代表,但是大陸不是,他們的點字代表是ABC的那一種拼音,香港又是另外一套,香港拼出來是廣東話,所以回到點字,你印出來的點字,兩岸三地是不通的。
剛剛一直講電子點字檔,在檔案的格式裡面是「.brl」,我們說既然現在已經進步到這個階段,視障者要能夠得到資訊均等,就是跟mainstream是一致的,你們拿到的是一般的「.txt」、「.doc」或「HTML」,都沒有關係,我們只要透過screen reader,想要用聽的人,轉出來透過TTS speech engine轉出來就是用聽的。有一些人從小有摸點字的習慣,透過screen reader,再外接一個Braille display,就是點字了,可用摸的。這樣可節省整體的社會成本。
回過頭來說,應該是三、四年以前,著作權法還沒有修法通過,廠商只要牽涉到版權的問題,就說:「不願意給,如果給的話,作者不一定同意。另外,當然也有一些原本在製作點字的單位,如果這樣下去,他們就沒有飯吃了,因為就不用再另做什麼點字了。這是當初的一些想法,後來我們有努力去爭取立法院的修法,我想應該是2014年著作權法有改,只是修法後中間還是有一些時間上的落差,我們知道滿多的特教老師,還是不知道,只要書商說這個會違反著作權法就不敢為視障生爭取要到電子檔了。
著作權法裡面寫的是說我們可以重製那一些資訊,因為也不太可能,他們也沒有辦法要求廠商或書商要提供,沒有一個硬性的規範,只是說可以把你的書跟文件,很多人的做法是掃描進去,然後再辨識出來文字,然後再修改,以往可能是違法的,但在著作權修改是可以這樣做,但是法律還是沒有規定,當然也沒有辦法硬性要求。
教育部在採購的時候,已經把這個列進去,他們也要提供這個,也就是要提供一般的電子檔。你看視障者分很多種,一個是全碼,一個是要放大的字體書。如果你有拿到書的電子檔,也就是一般「.docx」或者是「HTML」,就可以依個別需求,將其放大,解決了low vision視障生的需求,也可以改變背景跟字的對比關係,全部的視障生都可獲得解決了。像美國就有一個NIMAC(National Instructional Materials Access Center),他們就把所有有關義務教育的教材,全部都放到那個地方,如果其他單位想要做不同的格式,因為視障有不同的需求,有人想要轉成聲音的有聲書也可以,有的人想要放大也可以,有的人想要摸點字也都可以,現在國內欠缺類似這樣子。
其實在教育部那邊,有提到叫廠商一定要提供點字的書,如果視障者需要的話,但是沒有說一定要放到平台或者是提供一般電子格式讓視障者使用,現在沒有這樣的規範,我們當然希望能夠像王博士所講的有一個平台,最好是政府單位……我們之前也有接觸,也有找一些視障者,他們以前有推過,有類似這樣的想法,但是當時在談的時候,談到最後面是書商願意,希望政府單位來管理它,然後有一個對口可以對,但後來好像是政府這邊沒有。
也是有指定,就是國立臺灣圖書館,只是在執行上非常被動,有很多的理由。
我補充一下,因為臺灣圖書館做這一件事的時候,有找我去當委員,他們變成蒐集願意提供電子檔的廠商,也沒有一個規範去要求所有的廠商說所有的出版品就是要給一份電子檔,現在還是屬於道德勸說,像《天下雜誌》那一些都很樂意提供,但是並不是所有的廠商都願意。
這個牽涉到我們圖書館法有要求所有的著作都要送兩個copy,一個是國家圖書館典藏,另一份送立法院,這個是有的,我們當初也希望把這個加進去,也就是並不僅是print copy,也要提供電子檔的格式,如果可以納入這一個修法,是可以解決全面的問題。
因為我們最主要的酌量點是,可以節省整體的社會成本,因為整個國家社會的預算也不夠,按照著作權法來講,若出版商不給,我們還是可以找義工,發動去掃描變成EPub 3或者是「.doc」或者是「.txt」,是可以的,並沒有違反現行著作權法。只是明明電子檔已經在那裡了,還要再動員花更多人力去掃描、辨識及校對,這是額外浪費人力及時間。
也許也可以訂一個機制,出版商發行後,也可以提供一個公益公開版本,稍微貴個兩、三倍,至少給作者得到compromise,也讓他順便感覺到有照顧到身心障礙者,我覺得這樣在推動上,相對阻力會比較少,而不是說全部都免費。
其實有一些相關的,是牽涉到執行面的問題。
因為我之前有負責規劃過,從最簡單的書到最困難的書的紙本電子化的工作。最簡單的是教育部的注音符號手冊跟標點符號手冊,這兩本其實就是所有中文教育的最基本,這兩本長期都只有jpg檔,然後放在解析度很差的網頁上(笑),不要說親和力了,連一般人都很難去取用它,你無法搜尋,那一些也不是向量圖,比例還要自己湊到螢幕去算,只是把當年的書掃成jpg上網而已。因為這樣的關係,所以後來教育部開一個案子,我們有轉成EPub 3,都是用最新的技術,去把它做充分的向量化,所以像你們用螢幕閱讀器一定就可以完整看到那兩本書,那個我有全程參與。
最複雜的那一端,我有參加五南活用國語辭典的電子化,那個是非常困難的工作,因為他們的原始檔其實並不是設計給機器看的,如果設計給機器看的,像EPub 3格式,就是設計親和力的,因為可以轉成任何格式,當初五南這本辭典真的只是為了印刷,中間會用各種各樣,好比像注音符號是用國字,但是是用注音字型,碰到多音字的時候,還會用字型1、2、3、4,其實文鼎的字音字型沒有,還會兩個字去拼,或者用一個篆書的圖片去拼,在那樣的情況下,電子化可能花了兩年的時間,那是非常累,並不是掃成jpg,然後跑一遍OCR那麼簡單,這個很難要求每一個出版社都做,當時是因為mac跟ios這一版的內建國語辭典是蘋果出錢,把這一本書電子化,因此在這樣的情況下,我們終於有任何人都可以用的國語辭典。
在這兩端之間,我們做政策很難一下子就要求大家做最難的部分,那個也不實際。但是比較簡單的部分,也就是比較沒有這麼多像字典一樣奇怪的字,或者是版本並不像字典那麼要求,排版破壞掉沒關係的書,我們就可以這樣做。
我知道教育雲裡面有一個叫做「教育大市集(market.cloud.edu.tw)」,本來就有把所有教具的電子書,國中小的教育資訊,不管是App或者是E-book,等於是集成在這邊,這是教育雲的一部分,並不是圖書館系統,這個是目前國中、小老師都可以使用的一個資源。
因此從某個角度來看,這可以是一個線上集成的地方,如果你們已經聯絡到願意提供書商的話,在圖書館願意撥更多的經費,做這樣的館藏之前,可以上載到教材資源中心,至少是使用政府雲的經費作儲存跟編目,這是沒有問題的,至少這邊有一個資源可以用。
我完全同意長期下來,我們不應該再自己掃描,要嘛是全自動化來做這一件事,不然就是產出的時候,要把結構化的書給圖書館,這個東西我覺得著作權法新的修正,2016年版的修正,如果還沒有處理到的話,比較難在我們這一個會期處理,因為前面的訴求還沒有處理完。
如果在教育端的部分,比如他們在發包供應商那邊就要求教材的部分?
教育端這邊最容易的是,我們把遠距教室不要當作實驗,而是當作一般,像遠距教室不管是透過高品質的視訊或是之前講的自學再來線上討論的翻轉教育,願意參加的人就不會限於一個地方的人,一堂課有超過三個學校參加的時候,老師就會發現印紙本比較困難,而電子書比較容易,反正大家手上都有平板,在這樣的情況之下,才會給教學現場一個動機,買的時候甚至只買電子書,再也不要紙本,因為紙本只發給1/5的同學,其他的還要請宅急便到他們家,這是不合理的。
因此不妨當作遠距教學來推,比較不是只是為了電子書來推,確實比起紙本在現在的顯示技術來講比較差,閱讀體驗比較差,對眼睛的感覺比較差,而且在上面畫記號的時候,很難兩、三個人一起協作,這一些工具都是這一年在比較成熟,而且據我所知,教學現場還沒有人使用的。
當然過了三、四年等彩色電子紙、遠端協作,或甚至一些擴增實境的這些東西,慢慢出來之後,我覺得這個還可以回來檢討,但以這一代的技術而言,如果不引入遠端教室的話,如果我是老師,我還是會想要用紙本,因為紙本體驗還是比較好,所以我覺得目前只能這樣推。
奕勳,你之前提的數學……
喔!數學教材。其實我們跟張老師這邊,其實有申請一些計畫案,也就想要推數學教材的部分,我們知道HTML 5裡面,可以用MathML來編數學的格式,也就是可以編出比較複雜的公式,我們也去試過,像有一些screen reader也能夠支援這樣的格式,所以我們最後才想要推格式跟電子化的部分,這個是我們的想法。
當然未來教材有電子的話,也希望數學這一些東西能夠按照規範,不是用圖片貼上去,而是用一些標記法做出來。像剛剛也有提到向量可以做函數圖形,也希望可以這樣處理,有時政策這樣推出來,都說要電子,像我也知道台北圖書館也有現上可以借的,而電子檔有時候是圖的,有時是PDF的,有時標記不那麼好,所以如果訂要哪樣的時候,就是注意這樣的一些部分。
這個我相信沒有問題,因為維基百科的好處就是說大家在學生時代都用過,會用的是比較新的標記語言,不管是內嵌LaTeX或者是現在用的MathJax把數學公使顯示出來,只要有參加過維基百科編輯的人,都可以理解到符合各種各國不同閱讀者的需求,就是用語譯的方式去記,並不是用形狀的方式去記,這樣才可以翻譯,不然一個圖怎麼翻呢?
這個東西我們在試培的時候,就藉由參與維基百科的協作或其他方式,我們在政府裡面都是用最簡單的Markdown或HTML的這樣格式。只要有這樣的概念,你看到的跟你腦裡想的其實是兩層,其實也是前後解耦的概念,我覺得剩下的技術是隨著技術的演變,就會與時俱進,寫下來就是以腦裡的結構寫下來的,這對大家比較好的。
這個部分你們會需要法規或者是要點層次的幫助?或者只是文化?
這不是要點,也就是剛剛講要比較細緻一點,並不是單純寫一個電子檔,而是要訂,如果沒有辦法用MathML或SVG呈現的圖片,才用這個來做的這類細項東西,大概就是這樣子。
我們之前在國語會做剛剛講的標點符號跟注音符號的時候,發包的就是寫得很明白,只有萬不得已的時候才用圖片,這個語言我們是有的。
但是我不督導教育部,抱歉,我只有幫忙他們討論教育雲或者討論這一些計畫的時候,我可以提一下,也就是創用CC授權的重要性,因為可以自己去改格式,你提供初創CC圖片的話,其實是造成下一手的負擔,所以產製的格式就應該是你提供的格式,是這樣的概念。而這樣的概念,其實我相信也是節省大家的工作,並不是要做額外的工作,而是節省他的工作,我相信這個慢慢會推得出去。
我補充一些,原來會提到MathML的問題,是因為要解決大考中心的問題,他們希望未來只要是身心障礙者或者是視障者要考試,他們說視障者的部分要引入NVDA,但是要用Word這種格式利用NVDA來報讀,現在問題來了,NVDA沒有辦法把Word資訊報讀出來。
我們也瞭解到現在的HTML或者是WCAG 2.0或以後,事實上都支援到數學符號,或者是化學、物理的符號。
只要你的瀏覽器夠新...
現在我們訴求的重點是,瀏覽器很簡單,現在的Firefox也都是free的,只要你更新就好了。
現在的問題是做教育決策的人對這一個領域並不熟,我們也希望HTML或者是WCAG其實是一個開放的標準,如果HTML這個語法,很簡單的,只要考試的格式、考試的試卷,只要一個file,所有的問題都解決了,為什麼要弄一個很複雜的東西,比如像word這個東西來解決問題。
其實大考中心現在word的數學如何呈現,就是找人去把數學數字敘述出來,像開根號就打「開根號」三個字。這樣的方式不是很理想,當然我們之前也有問過他們那邊,他們也有提到這個問題又回到現在視障教育這端,到底有誰在使用這一個東西?
我問一下,word不是內建一個公式編輯器,也不是圖片。
對,但是在讀的時候,我不知道效果如何。
我的意思是,這需要技術解決的,這不需要OCR,你把一個Word的格式用成MathML或中文字的一個軟體?
對。
應該這樣說,screen reader的功能還是有差別的,為什麼commercial可以賣那麼貴?原因就是有去解決一些應用軟體大家常用的功能,好比Word跟JAWS可以解決。為什麼JAWS可以解決?因為微軟本身也考慮到accessibility,所以跟JAWS的那一家公司合作,但是NVDA功力還沒有到可以解決那一方面,所以現在如果回過頭來,使用Word,某種程度需要求所有的考生要想辦法買那一套JAWS來用,而且老師也都要會,就會花許多錢。
他們上個禮拜或者是幾個禮拜前去大考中心去談過,最主要的是你們講的都很有道理,有誰會用,有誰教這一學生?考了這一些考題,結果學生、家長發現平時在學校都不是這樣考試,怎麼可以用這一個考題給我們考?我們學校老師根本也不知道要如何做出這樣的試題來,雖然很棒,但是學生都不會。
我講的並不是內容不會,而是連讀到的內容都沒有辦法,所以要從教育端那邊就先切入,到底誰來引發教育端來做這一些動作,這是另外一個事。
我還是比較技術導向,LibreOffice我也有幫忙解決一些字型問題,我對它的code base還算瞭解。LibreOffice好像在第四版的時候,花了很多力氣去做裡面formula的部分,我記得Word的formula是打得開的,即使你是doc檔,但是你不是用Word開,而是用LibreOffice開,開了之後應該是可以匯出成LaTeX才對——我如果沒有記錯的話——其實那是一個你打開另存新檔就可以解決的問題,或者甚至是NVDA不能跟Word配合,也許可以跟LibreOffice存出來的那個HTML配合。你知道我的意思嗎?就是中間可能還是有一個轉檔的動作,還是你們已經測過了?我不知道,我也可能是錯的。
我們的訊息是大考中心決定用格式的。
格式一回事,你可以用LibreOffice開它。
但是考試的時候不會讓你這樣轉。
為什麼?
Word就Word。
一台機器也可以裝兩個啊!
可是的機器規定你,不能自己攜帶。
對,但是你可以要他兩個都裝。
好像不行。
這個就是政策問題,如果他們直接轉好成HTML提供給考生是最理想。
既然HTML什麼都可以支援,為什麼還要再選Word?就這個意思而已。
對,我理解。這裡就有兩個,如果他用Word檔打開,另存成HTML,你們就可以讀了,這個問題就自動解決了。
事實上原始的source就沒有辦法看到。
所以本來是圖嗎?
本來是中文化。
就是以中文敘述的方式呈現,例如一元二次方程式的解。
就直接用中文化的意思。
是描述成文字。
應該是說,我們最原始給一般明眼人看的,我們不知道公式到底是用什麼做出來的。
這就要問清楚。
你們剛才整個訴求我聽出來,不管是點字或者是什麼,就是拿明眼人的原始碼,變成最容易看的狀態,中間經過多少的中繼格式都是歷史的遺跡,我們不管它,現在理想的狀況是,我們先問大考中心這些公式給明眼人看的時候是用什麼打的,然後不管是Word或者是LibreOffice打開,存成HTML,看NVDA能不能讀,我覺得應該是這個順序。
這個順序沒有錯。
現在問題是,連教育體系都沒有人用過,數學的教材是空白的,根本就沒有提供給視障者相關格式,所以沒有辦法寫,如果是用MathML的格式產生教材的話,那就沒有問題。
其實我們去大考中心,最後的結論是,我們希望教育體制這邊能夠先有一些動作,然後推出HTML這樣的格式,然後讓視障者從小就使用這一些格式,慢慢接上來之後,大考中心自然而然就一定要採用這樣的方式。
如果從最末端的考試端去推的話,因為其他人都沒有用過,所以我們還是希望教育端開始著手,因此才會提到希望教課書都能夠有電子檔並符合這一個格式。
聽起來最前端教科書電子檔的這件事,包含產製的時候是用Word或者是PPT做,確定轉成HTML或者是Epub時,是用向量或者是語譯方式存下來,我覺得這個才是重點,因為你的考點一定是從教科書同一個編輯器寫的,不會有人考題用另外一個編輯器寫的。
現在事實上考試是沒有用系統的,只是讓你用影音聽一聽作答,照理說用一個標準的考試結構來做,好比原始的東西丟出去的時候,你在上面作答,我把答案抽走就好了,這個是最簡單的,不用說數學還必須要文字化,如果文字化的話,每一個人的邏輯也不一樣。
是,而且工作也省了。
對,現在就是這個問題。
甚至連五專考試的NVDA、語音都沒有,所以並不是想像這麼進步,這一些都是空白的,事實上在教育的體系裡面,數學的教材很多是拿不到的,其實很多電子檔都沒有。
連掃描過的PDF都拿不到
電子檔都拿不到,不然NVDA下去的時候,聲音出不來,因為沒有邏輯,並不像MathML上面有一個標準邏輯,所以變成老師來教的時候,事實上明眼的老師可以教,因為有報讀系統可以知道是怎麼教的,但是如果拿到的是無字天書的時候,明眼老師連教都沒有辦法教,因此視障者這一塊的權利是被犧牲掉,連教材都沒有,所以被放棄,因此後段要進入到資訊無障礙很難,因為邏輯性、數理性的基礎都不見了,問題在那裡。
我確認一下,現在並不是法規擋住,也不是檔案格式擋住,就是現場的人員沒有那個動機或是沒有那個訓練?
其實也沒有內容。
因為出版商不願意給那個教材。
現在應該還是牽扯到整體的系統性考量,我們已經知道MathML這一種標記是可以workout的,但還是要有人把整套的教材寫出來並提供訓練,從老師開始訓練,讓學生也可以知道讀這個,同樣的MathML也是要知道邏輯是怎麼樣,因為中文跟英文又不一樣,像我們講2/3,英文並不是這樣講,因此還對於公式的描述邏輯是不太一樣,需要處理,這個是要有一套教材的。因為早期普遍認為視障者無法學好數學,就將其放棄了,那時不考試,所以更不會 教,現在有考試,可以了,只是師資也是一個問題、教材也是一個問題,所以滿多問題,我們今天只是講如何來製作,但其實是一個全面性的問題。
我覺得教材是最關鍵的,有一些教材,有的人就會去試,好用就會去推,大家就會去使用,但是現在連這個東西都沒有,人家要用也沒有辦法用,覺得這個東西很好用,但是其他的教材拿不到,我們也沒有辦法讓其他人真正使用那一些東西。
我想問一下,很多用CC授權自己製作數學教材的朋友,我在網路上也知道一些,像自由數學有一些,他們滿多會使用GeoGebra的軟體,尤其是教到幾何的時候,那個視障者應該很難使用……
對,圖形化的東西。
我上次看是沒有看到人家使用。
「自由數學(math.alearn.org.tw)」這個也許花一點時間看,是朱佳仁老師跟唐宗浩老師——就是我弟(笑)——用CC授權,我記得是完全拋棄掉著作權的狀況,也可以看一下格式上,也許你們是不是可以使用,就是剛才老師說的,把考卷跟教材做在一起,所以考卷也是HTML的。我相信裡面還是有一些不完全符合你們需要的,可能還是會有一些,我看到一堆幾何,應該還是有圖片……
……是向量圖也好,或者是一般圖……
是向量圖比較好?
向量圖只要沒有辦法看,視障者就沒有辦法理解。
對,沒錯,所以幾何真的是比較困難。
一般教材這部分還是有需求,很多學生還是在學校體系這邊,他們還是要有一些原本學校的教材,如果同學在上課,需要有相同的教材。
重點是書商……
……對,我們希望是教科書的書商提供HTML的格式。
HTML的格式……
提供HTML格式的教科書?
對。
這個應該還是關鍵。並不是所有的人都能在網路上用翻轉的方式在學習,因為家長也要很熟悉這一些東西…
這我完全同意。如同我剛剛所說的,我所知道很多書商的排版軟體,其實很難產生HTML,如果是用InDesign排的話,出來的HTML完全沒有語義性,那是很困難的,要特別針對那本書的排版寫一支程式,那不比處理PDF簡單到哪裡,因為就是用PDF的概念去排版。
所以就會變成我們要問哪一些書商已經是用這一種,我們叫做不限制閱讀佈局的大小方式在做書,先給那些談會比較容易,如果是Fix layout的話,轉成EPUB3,說不定都是一個字給你放左上角,下一個字放右上角一點點。
是圖形化的排版方式。
我所知的可能大部分都是這樣,但是說不定有存在是用語意排版的書商,我知道他們為了做電子書,很多產製的流程會回去用Markdown,要一次產生手機版、平板板跟桌面的時候,編輯流程必須要修改,但那就是新書,舊書不會回去重排,所以一些比較新的出版社或是老的出版社重新做教科書的時候,你們去談就比較有機會。
我想教育部很難要求書商從107課綱的時候,全面檢討排版規則,我以前在課發會的時候,也沒有辦法要求那麼細,但是在學校層級的課發會或許可以提出這樣的要求。
所以我覺得另外一個可以遊說的單位是你們學校的課發會,在採買的時候可以以一個區域,尤其那個區域把視障當作一件事在做的時候,他們在採買的時候去詢問書商,或甚至要求書商在排版的時候,就用這種響應式的方式排版,我覺得這樣子比較實際,如果我們硬去施壓,如果真的是用InDesign排的,施壓了也沒有用,也出不了東西。
好,大概就是這樣。
剛剛唐政委有提到教育雲的部分,對於大專程度的全盲生來講,因為大專不同科系……
對,這個比較是義務教育使用。
這個問題很大,像我們之前英語系有全盲學生,開學已經期中了,媽媽跑來跟我講說到現在還沒有拿到一本點字書,是英語系又很多外文書,因此在大專的部分其實也是問題。
英語系的話,如果你把書邊裁掉,丟進高速掃描器,OCR變成文字檔,英語系的正確率非常高。
對,但是就是因為不同課程,每個課程的老師指定一、兩本教課書,所以量製作起來其實很大,學校的特殊教育資源可能來不及做,媽媽自己用點字機打得很辛苦,跑來找我說該怎麼辦。
學校旁邊找一家影印店可以做的事,還是我想得太簡單?因為我們之前做很多這種事(笑)。
可能牽涉到有些人不知道。
一般人不會知道OCR。
應該這樣講,請影印店掃描一堆很大的PDF檔,學校旁邊的影印店都有這個能力。
這不是太大的問題,因為我找到平板的掃描。
可以自動送紙嗎?
不用,我們是手動自己掃,很便宜,因為都不用裁書,大概一個小時可以掃四百頁。
但是還是要人自己去翻。
我都是用裁的,就把邊整個裁掉,然後丟進自動掃描器,而且那個也很便宜,大概是4、5000元。
自動掃描器會自動翻頁嗎?
不是,因為你裁掉就會單張,你就像放印表機的位置,它就自己掃了,你什麼事都不用做。那個速度很快,而且掃出來,我記得600 DPI都還很便宜,如果英文600的已經非常夠用,我覺得真的試試看這樣子做,因為求軟體真的比求人簡單很多(笑)。
英文外還是滿多中文的部分,中文真的很難。
中文真的很難,這個是真的。
現在大概是97%。
還是要有人校對。
或者你要買很好的,可以掃到1,200的,正確率可以再高一點。
不一定,因為太細的時候,甚至辨識還比較不好,其實差不多300左右還比較理想。
喔!真的啊?
對。
主要是要看版面的部分,如果很工整,辨識率還算高,版面的部分會比較影響到辨識率。
當然隨著機器學習的進步,也許過兩年這個不是問題,中文就到百分之百了;但是至少過渡的這幾年,在著作權法不違法的部份,我覺得重點還是推廣這一個觀念,這可能很重要。
我們有做一個雲端千眼,也就是招志工,進行校對,我們幫他們做掃描跟丟檔後,志工線上幫忙校對文字。
我們之前有把監察院的政治獻金拿出來做(笑),也是上萬人幫忙(笑)。
我覺得至少概念上,反正我們講話會變逐字稿,這個逐字稿就歡迎任意利用,連結到裡面某一句話都可以,那也是結構化資料,如果我們的逐字稿格式,你們用screen reader有問題要跟我們講,但那應該是有測試過,是沒有問題的。
ok。
好,那今天先這樣。
謝謝唐政委。
謝謝大家。