※aozorahack hackathon #1(2016/07/30-31)の成果物です。2018/07/26より、青空文庫本体に取り込まれています!(ref. #7)
青空文庫の図書カードにOGPを設定しました。 これにより、FacebookやTwitterでシェアした時などに表示される情報を改善できます。
OGPやOGPを使ってシェアされたものの例はFacebookのウェブ管理者向けシェア機能ガイドやTwitter Cardの説明ページを参照してください。
図書カード:No.5のあいびき( by 青空文庫; CC BY 2.1 JP )に手を加えてOGPを設定してみました。
添付している画像は、Facebookのシェアボタンを押した時とのスクリーンショットです。 Open Graph Debugger(閲覧にはログインが必要)を使って取得しています。オリジナル版以外はTwitterでも同様の表示になります。
作者情報の表記は、XHTML版のtitleタグの内容を参考にしています。
スクリーンショット | HTML |
---|---|
card5.html(オリジナル) | |
card5_1.html(OGPに、タイトルと作者情報を含めたもの) | |
card5_2.html(OGPに、タイトルと作者情報と本文の冒頭を含めたもの) |
Rubyを使います。
aozora2html
が必要です。
gem install aozora2html
以下を実行すると指定した図書カードのHTMLにOGPのためのメタデータを埋め込めます。
ruby aozora2unicode.rb --apply-ogp CSV INPUT OUTPUT
CSV
:list_person_all_extended_utf8.csv
に相当するファイルかそれを圧縮したzipファイル、またはそのURLINPUT
: 図書カードのHTMLファイル、またはそのURLOUTPUT
: 出力先のファイル名
このとき以下で生成される内容の先頭256文字が図書カードのdescription(FacebookやTwitterで表示される説明文)になります。
ruby aozora2unicode.rb INPUT OUTPUT
INPUT
(青空文庫のテキストファイル/それを圧縮したzipファイル/そのzipファイルのURL)からUTF-8のテキストファイルを生成してOUTPUT
に出力されます。
- アクセント符号→対応するUnicodeに置換
- 外字→対応するUnicodeに置換(あれば)
- ルビ→漢字(かんじ)
- 字下げ等のタグ→削除
- 外部の画像等→
alt
属性のみ
このレポジトリのライセンスはCC BY 4.0です。