Untuk kemiripan kata (huruf) bisa saja dihitung berdasarkan jumlah kata. 
Langkahnya bisa begini:
   
  1. Parsing word dengan regular expresion space (space tokenizer).  Dihitung 
berapa kata untuk masing2 string.  Ambil count untuk string dengan jumlah 
terbanyak (m_cWords).
  2. Compare tiap word untuk untuk masing2 string (ignore case).
  3. Jumlahkan word yang sama (m_sWords).
  4. Return m_sWords/m_cWords.
   
  Kalau pakai c++, perlu bikin program parsing sendiri, kalau pakai c# sudah 
tersedia class untuk Regular Expresion. 
   
  Untuk kemiripan makna, program lebih rumit, referensi bisa baca mengenai NLP 
(Natural Language Procesing), trutama mengenai ontologi kata. Untuk kata 
berbahasa Inggris sudah banyak library yang bisa dipakai, namun untuk bahasa 
Indonesia, perlu dibuat sendiri.
   
  
ardiansyah <[EMAIL PROTECTED]> wrote:
          Kemiripan pola huruf. Langsung aja dech, saya mau migrasi data dari 
Excel ke MSSQL. Di file excel orang bisa tulis nama perush seenaknya: 

PT Matahari Lintas Regional Indonesia
Matahari Lintas RI
PT. Matari Lintas 
Matahari Lintas Regional, PT.

Tentunya keempat string itu cukup saya simpen satu kali aja kan ? 

Saya pengen bikin fungsi yang kira-kira kayak gini (C#) : 

decimal CompareTwoString(string s1, s2)
{

}

dimana nilai kembaliannya adalah prosentase kemiripannya, misal 100 kalau kedua 
string identik, 0 kalau keduanya sama sekali tidak identik. Kalau hasilnya 80, 
saya bisa curiga kalau kedua string itu boleh mirip, lalu saya bisa eleminasi 
salah satunya. 

Regex ....??? ada contohnya ? 

syarifl <[EMAIL PROTECTED]> wrote: setahu saya ada (3) kemiripian makna, 
kemiripian pengucapan dan kemiripian
pola huruf. Kalo yang makna saya kurang tau tapi kalo kemiripian pengucapan
namanya SOUNDEX sedangkan kemiripan pola huruf itu REGEX.

Soundex berbeda di tiap bahasa, untuk mulai silahkan kesini:
http://en.wikipedia.org/wiki/Soundex

Regex kesini:
http://en.wikipedia.org/wiki/Regex

yang kemiripan makna spt anda bilang saya blon nyampe ilmunya he.he.he.

On 7/7/06, ardiansyah <[EMAIL PROTECTED]> wrote:
>
> Apakah ada rekan2 yang bisa beri petunjuk bagaimana membandingkan dua buah
> string sehingga kita tau berapa persen kemiripannya?
>
> Contoh:
> string 1: "aku cinta kamu"
> string 2: "aku tidak cinta kamu"
>
> Mestinya kedua string itu boleh kita bilang mirip, karena hanya berbeda di
> kata "tidak".
>
> Kalau kita punya string ke 3: "kamu cinta aku", ini mirip enggak ya ?
> tergantung algoritmanya .....
>
> Saya sangat berterima kasih kalau ada rekan2 yang bisa mencarikan atau
> membuatkan algoritmanya ....

...del...

-- 
// syarifl.com

[Non-text portions of this message have been removed]





Send instant messages to your online friends http://uk.messenger.yahoo.com 

[Non-text portions of this message have been removed]



         

                
---------------------------------
Do you Yahoo!?
 Everyone is raving about the  all-new Yahoo! Mail Beta.

[Non-text portions of this message have been removed]





-- 
www.itcenter.or.id - Komunitas Teknologi Informasi Indonesia 
Info, Gabung, Keluar, Mode Kirim : [EMAIL PROTECTED] 
:: Hapus bagian yang tidak perlu (footer, dst) saat reply! :: 
## Jobs: itcenter.or.id/jobs ## Bursa: itcenter.or.id/bursa ##
$$ Iklan/promosi : www.itcenter.or.id/sponsorship $$

[@@] Jaket ITCENTER tersedia di http://shop.itcenter.or.id 

 
Yahoo! Groups Links

<*> To visit your group on the web, go to:
    http://groups.yahoo.com/group/ITCENTER/

<*> To unsubscribe from this group, send an email to:
    [EMAIL PROTECTED]

<*> Your use of Yahoo! Groups is subject to:
    http://docs.yahoo.com/info/terms/
 


Kirim email ke