Nosaukums#

Kas šis ir

Šis ir Hackers.lv forums, apstrādāts tā, lai pēc iespējas mazāk būtu jālasa žargonu.

Autors

Autors ir Pēteris Caune, viņa mājaslapa ir šeit, un viņa e-pasts ir pc_ at one lv.

Vēsture

13.07.2004 - Jaunās lietas:

24.05.2004 - Vienkārša, statiska statistika.
11.05.2004 - Pārveidotie vārdi ir izcelti, un, paturot virs tiem peli, ieraugām oriģinālo vārdu.
20.04.2004 - Tiek palaista pirmā, visai zaļā lapas versija.

Par mērķiem un līdzekļiem

Mērķis - padarīt hackers.lv forumu lasāmāku.
Nereti dzīvē pienāk brīži, kad gribās paīsināt laiku - stāvot pieturā, braucot sabiedriskajā transportā, stāvot rindā, sēžot uz lielā, baltā telefona utml. Tādās reizēs mēdzu ņemt telefonu un lasīt hackers.lv forumu, izmantojot WAP. Šeit sākas problēma, - šajā forumā plaši un nevajadzīgi tiek lietoti žargonvārdi un anglicismi. Tādi teikumi, kā šis, tur tiešām nav retums: "jānokačā pāris drivakus lai var pierubīt kasti, uzlikt slacku, un servaks suportēs visus redirektus".
Radās doma uzrakstīt programmu, kas iespēju robežās šajos foruma tekstos "sliktos" vārdus aizvietotu ar "labajiem". Tālākā nākotnē paredzēts piedāvāt pieeju šim pārlabotajam forumam arī caur WAP.
Kas tiek darīts šobrīd? Reizi 10 minūtēs (vai retāk, ja nav apmeklētāju) tiek ielasītas jaunās foruma tēmas un komentāri, pārkonvertēti un noglabāti datubāzē. Datubāzē tiek glabāta gan teksta oriģinālā, gan pārkonvertētā versija, lai konvertēšana nebūtu jāveic pie katras lapas apskates.
Katra teksta konvertēšana notiek 3 soļos:

  1. Tekstā tiek aizvietoti vārdi, vadoties pēc slikto-labo vārdu vārdnīcas ("raxta->raksta", "nets->tiikls" utt.)
  2. Tiek veikta detransliterācija (nereti gan ne pārāk veiksmīgi)
  3. Gatavais teksts tiek konvertēts uz utf-8 (oriģināls ir windows-1257)

Pārkonvertētais teksts tiek noglabāts datubāzē, un turpmāk ņemts no turienes. Katru reizi papildinot vārdnīcu, pa jaunam jāpārkonvertē visu DB saturu.

Ar pašreizējo slikto-labo vārdu vārdnīcu varat iepazīties šeit.

Problēmas

Ar šādām vienkāršām darbībām var izskaust lielu daļu "nesmukumu", diemžēl, ne tuvu ne visus. Daudz problēmu paliek - izlaisti burti vārdos, nepareiza vārdu kārtība teikumā, stila kļūdas, utt. utjpr.

Šobrīd šeit viss ir svaigs, zaļš, un netestēts. Kad būs pagājis kāds laiciņš un varbūtējās problēmas būs +/- novērstas, paredzu publiskot skripta tekstu.