Ok, wlasnie mam wiecej czasu zeby sie tym zająć
Teorie mam chyba za soba

, mam teraz do was prosbe, co waszym zdaniem powinienem wziasc pod uwage jako cechy charakterystyczne(atrybuty) przy analizie wiadomosci?
Moje typy:

zrodlo wiadomosci

typ pliku (html txt itd.)

typ załącznika

wystÄ…pienie linka

oczywiscie analiza wszystkich słow
Jesli przyjdzie komus jeszcze jakis pomysl to niech tu pisze

. Z gory dzieki za pomoc.
::edit:
Mam jeszcze jedno pytanko w czym najlepiej byłoby to napisać??
Należy wziasc pod uwage fakt ze program ten bedzie pracowal ze spora baza danych słów i jeszcze z 3 malymi.

JAVA?

C++?
raczej te dwa jezyki wchodza w gre bo znam je dobrze
A baza moze w Mysql? Co o tym myslicie?
A i jeszcze przemyslalem sprawe analizy slow, moze warto byloby jednak napisac program ktory analizuje caly text i rozumie go, bo ostatnio dostalem spamy ktore skladaja sie z belkotu 'zwyklych slow' aloe jednak maja cos do przekazania.
