SubwayTooter-Android-App/_Emoji/readme.md

161 lines
6.0 KiB
Markdown
Raw Permalink Normal View History

2021-06-09 01:44:12 +02:00
------------------------------------------------
# 概要
絵文字データをアプリから使いやすい形式に変換します。
2021-06-09 01:44:12 +02:00
------------------------------------------------
# 依存データ
2018-09-22 20:55:25 +02:00
2021-06-09 01:44:12 +02:00
## emojione v2.2.7 (古いMastodonとの互換性のため)
2021-06-09 02:55:12 +02:00
```
rm -fr emojione
git clone -b v2.2.7 git@github.com:emojione/emojione.git emojione
2021-06-09 02:55:12 +02:00
```
2018-09-22 20:55:25 +02:00
2021-02-15 08:32:16 +01:00
## Gargron's fork of emoji-mart (master branch)
2021-06-09 02:55:12 +02:00
2021/02 不要になった
```
# rm -fr emoji-mart
# git clone git@github.com:Gargron/emoji-mart.git emoji-mart
```
## emoji-data
```
rm -fr emoji-data
git clone git@github.com:iamcal/emoji-data.git emoji-data
2021-06-09 02:55:12 +02:00
```
2018-09-22 20:55:25 +02:00
2021-06-09 01:44:12 +02:00
## マストドン公式
2021-06-09 02:55:12 +02:00
```
rm -fr mastodon
git clone git@github.com:tootsuite/mastodon.git mastodon
2021-06-09 02:55:12 +02:00
```
2021-06-09 01:44:12 +02:00
## twemoji
2021-06-09 02:55:12 +02:00
```
rm -fr twemoji
git clone git@github.com:twitter/twemoji.git twemoji
2021-06-09 02:55:12 +02:00
```
2021-06-09 01:44:12 +02:00
## noto-emoji
2021-06-09 02:55:12 +02:00
```
2021-02-19 02:18:58 +01:00
rm -fr noto-emoji
git clone git@github.com:googlefonts/noto-emoji.git noto-emoji
2021-06-09 02:55:12 +02:00
```
2021-02-19 02:18:58 +01:00
2021-06-09 01:44:12 +02:00
## emoji4unicode
2021-06-09 02:55:12 +02:00
```
2021-02-19 02:18:58 +01:00
rm -fr emoji4unicode
git clone git@github.com:google/emoji4unicode.git emoji4unicode
2021-06-09 02:55:12 +02:00
```
2021-02-19 02:18:58 +01:00
2021-06-09 01:44:12 +02:00
## override/ フォルダ
優先的に使いたいsvgやpngを入れておく
2021-06-09 02:55:12 +02:00
```
1f923.svg 傾いた笑う顔。演出的な理由でMastodonで使われている
265f-fe0f.svg Black Chess Pawn. Emoji 11.0 で追加されたがtwemojiに入ってない。
267e-fe0f.svg Permanent Paper Sign. Emoji 11.0 で追加されたがtwemojiに入ってない。
2021-06-09 02:55:12 +02:00
```
2021-06-09 01:44:12 +02:00
----------------------------------------------------
# 作業手順
2018-09-22 20:55:25 +02:00
2021-06-09 01:44:12 +02:00
## 前準備
2021-06-09 02:55:12 +02:00
```
2021-06-09 01:44:12 +02:00
mkdir -p assets drawable-nodpi
rm -fr assets/* drawable-nodpi/* category-pretty.json
2021-06-09 02:55:12 +02:00
```
2021-06-09 01:44:12 +02:00
## ビルド
2021-06-09 02:55:12 +02:00
- IntelliJ IDEA で emojiConverter のプロジェクトを開く
- Gradle sync
- Main.Ktを実行。CWD は _Emoji にする。
2021-06-09 01:44:12 +02:00
## 出力
2021-06-09 02:55:12 +02:00
- drawable-nodpi の中身を C:\mastodon-related\SubwayTooter\emoji\src\main\res\drawable-nodpi にコピー。 (現時点ではカラ)
- assets の中身を C:\mastodon-related\TestEmojiSvg\app/src/main/assets にコピー。 TestEmojiSvg をビルドしてエラーが出ないか試す
- assets の中身を C:\mastodon-related\SubwayTooter\emoji\src\main\assets にコピー。
- emoji_map.txt を C:\mastodon-related\SubwayTooter\emoji\src\main\assets にコピー。
2018-09-22 20:55:25 +02:00
2021-06-09 01:44:12 +02:00
---------------------------------------------------------------------
2021-02-24 15:24:56 +01:00
# 2018/9/23 メンテナンス
2018-09-22 20:55:25 +02:00
今のマストドンが利用している絵文字データの再確認。
MastodonのJavaScript依存パッケージ
https://github.com/tootsuite/mastodon/blob/master/package.json
では、フォークされたemoji-martが使われている
https://github.com/Gargron/emoji-mart
そのemoji-mart は "emoji-datasource": "4.0.4" に依存している。
npmのemoji-datasource は iamcal/emoji-data のことだ
https://www.npmjs.com/package/emoji-datasource
https://github.com/iamcal/emoji-data/tree/v4.0.4
カテゴリ情報はコレ
https://github.com/Gargron/emoji-mart/blob/master/data/all.json
絵文字データはコレ
https://github.com/iamcal/emoji-data/blob/v4.0.4/emoji.json
が、上記は絵文字ピッカーの話であり投稿後のデータの絵文字表示には使われていない。
たとえば rolling_on_the_floor_laughing は絵文字ピッカー内部では泣いていないが、投稿後は泣いている。
投稿後のデータのUnicode絵文字に使われているのはMastodon公式リポジトリにあるsvgファイルだ。
https://github.com/tootsuite/mastodon/tree/master/public/emoji
2021-02-24 15:24:56 +01:00
---------------------------------------------------------------------
# 202102 メンテナンス
## Motivation
- Gargron/emoji-mart が古すぎる。カテゴリ一覧は他の場所から持ってくるべき
- Emoji 13.1対応の画像でライセンス的にアプリで使えそうなのはnoto-emojiくらいしかない。
## Changes
- 出力データをJavaコードではなく emoji_map.txt に変更した
- 変換コードをPerlからKotlinに変えた。いままで適当だったCodepointListなどをInt配列で扱えるので精密さが増した。
- noto-emoji や emoji4unicodeを読むようになった
- Emojipediaからバージョン別絵文字一覧やカテゴリ別絵文字一覧を読むようになった。
-- カテゴリ一覧をEmoji 13.1に対応できる
-- 実際に使われているfull qualified codeを確認できる
- スキントーンの親子関係を検証,列挙するようになった
---------------------------------------------------------------------
# emoji_map.txt のフォーマット
2021-06-09 01:44:12 +02:00
## 基本的な構造
2021-02-24 15:24:56 +01:00
- 行区切りは\x0a。
- 行ごとに始端と終端をtrim{ it<= 0x20} する。
- 行ごとに//以降を読み飛ばす。
- 各行の^(\w+): 部分がヘッダ。
2021-06-09 01:44:12 +02:00
## ヘッダとその処理
2021-02-24 15:24:56 +01:00
svg または drawable
: 絵文字の画像リソースを表す。
un または u
: 直前に画像リソースが指定された絵文字に対して、Unicode表現を表す。
: 絵文字をUnicodeに変換する時はunで指定されたデータを使う(必ず提供される)。
sn または s
: 直前に画像リソースが指定された絵文字に対して、ショートコード表現を表す。
: 絵文字をショートコードに変換する時はsnで指定されたデータを使う(必ず提供される)。
cn: カテゴリ名
c: 直前に指定されたカテゴリ名に対して絵文字を追加する。パーサは登場順序を維持すること。
t: トーン指定。カンマ区切りでトーン適用前の絵文字、トーンコード、トーン適用後の絵文字を表す。
2018-09-22 20:55:25 +02:00
2021-06-09 01:44:12 +02:00
## トーンコード
2021-02-24 15:24:56 +01:00
絵文字中の skin tone modifiersだけを抽出したもの。
u1F3FB, u1F3FC, u1F3FD, u1F3FE, u1F3FF のコードポイントが1文字以上並ぶ。
絵文字ピッカーでは1文字のトーンコードを持つ絵文字に対してトーンを選択できる。
トーンコードが2文字以上ある場合は、絵文字ピッカーでは「複合トーン」カテゴリから選択できる。