Pages

Selasa, 01 Juli 2014

Dictionary bahasa Indonesia untuk Link Grammar Parser

Saya mencoba bereksperimen membuat dictionary bahasa Indonesia sederhana untuk Link Grammar Parser versi 4.7.4 (yang tersedia di distro Ubuntu/Linux Mint 17). Project ini saya share di https://github.com/ceefour/link-grammar-id dengan lisensi open source MIT (sesuai lisensi dictionary link-grammar versi English).


Dictionary yang saya gunakan:

kuda gajah unta kucing anjing tikus burung: S+ or O- or O+;
Prabowo Jokowi saya: (S+ or O+) or (Oh- & {W-});

makan memakan lari berlari: S- & {W-};

apa apakah: Ss+;
siapa: Oh+;

itu: (Ss- & O+ & {W-}) or (O- & Ss- & {W-}) or (O- & Ss- & {W-});

LEFT-WALL: W+ & {Xp+};

"?": Xp-;

Hasilnya adalah sebagai berikut:

link-grammar: Info: Library version link-grammar-4.7.4. Enter "!help" for help.
linkparser> siapa Jokowi?
Found 1 linkage (1 had no P.P. violations)
        Unique linkage, cost vector = (UNUSED=0 DIS=0 FAT=0 AND=0 LEN=3)

    +--------Xp--------+
    +-------W------+   |
    |       +--Oh--+   |
    |       |      |   |
LEFT-WALL siapa Jokowi ? 

linkparser> apa itu kuda?
Found 1 linkage (1 had no P.P. violations)
        Unique linkage, cost vector = (UNUSED=0 DIS=0 FAT=0 AND=0 LEN=4)

    +--------Xp--------+
    +-----W----+       |
    |      +-Ss+--O-+  |
    |      |   |    |  |
LEFT-WALL apa itu kuda ? 

linkparser> apa itu kucing?
Found 1 linkage (1 had no P.P. violations)
        Unique linkage, cost vector = (UNUSED=0 DIS=0 FAT=0 AND=0 LEN=4)

    +---------Xp---------+
    +-----W----+         |
    |      +-Ss+--O--+   |
    |      |   |     |   |
LEFT-WALL apa itu kucing ? 

linkparser> apa kucing itu?
Found 1 linkage (1 had no P.P. violations)
        Unique linkage, cost vector = (UNUSED=0 DIS=0 FAT=0 AND=0 LEN=6)

    +---------Xp---------+
    +--------W--------+  |
    |      +----Ss----+  |
    |      |     +--O-+  |
    |      |     |    |  |
LEFT-WALL apa kucing itu ? 

linkparser> siapa saya?
Found 1 linkage (1 had no P.P. violations)
        Unique linkage, cost vector = (UNUSED=0 DIS=0 FAT=0 AND=0 LEN=3)

    +-------Xp-------+
    +------W------+  |
    |       +--Oh-+  |
    |       |     |  |
LEFT-WALL siapa saya ? 

linkparser> kuda makan
Found 1 linkage (1 had no P.P. violations)
        Unique linkage, cost vector = (UNUSED=0 DIS=0 FAT=0 AND=0 LEN=1)

  +--S-+
  |    |
kuda makan 

Saya pikir untuk keperluan Lumen Robot Friend Knowledge Base saja yaitu pengenalan kalimat setara playgroup/TK, menggunakan Link Grammar cukup masuk akal. Tapi kalau membuat Link Grammar dictionary bahasa Indonesia, itu bisa jadi topik thesis tersendiri he..he.. ;-) (dan tentunya butuh pengetahuan formal di bidang sastra dan tata bahasa Indonesia)