adatbányászat - 10 megfelelő bejegyzés.

Mutass mindent

Jelöld be, hogy főbb mely kategóriákat akarod olvasni, vagy ha csak egyet: kattints a nevére.


mindet
jan
feb
már
ápr
máj
jún
júl
aug
sze
okt
nov
dec
2011
-
-
-
-
-
-
-
-
-
-
-
2008
-
-
-
-
-
-
-
-
-
2007
-
-
-
-
-
-
-
-
Haszprus

New Technology Meetup 2011/08

©   Haszprus   |   adatbányászat barátok bme képzés

Tegnap voltunk Orcával és PAStheLoDdal New Technology Meetupon. Megint ötmillió ismert arc. A két legjobbat kiemelném.

  • Stefan Marsiske: Demokrácia oprendszer hackolás + adatbányászat - ez kurvajó volt
  • Lévai Gábor ügyvezető igazgató ( Meta-MPI Kft.): Metapay - a magyar fizetési megoldás - ez pedig impresszív
  • Korcsok Zoltán ( iPont): 3D broadcast szemüveg nélkül
  • Solymosi János Urtechnológiai Igazgató ( BHE Bonn Hungary Kft .): Korszeru magyar elektronika amerikai muholdakon
  • Fabók Zsolt ( http://zsoltfabok.com): A Kanban alapelvekrol 5 percben
Tamás

A Last.fm zenekarok hasonlósági gráfja

©   Tamás   |   adatbányászat zene

Volt már szó itt a blogon régebben a Last.fm-ről, úgyhogy csak röviden: ez egy közösségi oldal, ami alapvetően a zenei ízlés köré szerveződik. Felraksz egy plugint a zenelejátszódhoz, ami innentől kezdve folyamatosan küldi a Last.fm szerverének, hogy mit hallgatsz, az pedig megjelenik a saját Last.fm-es profiloldaladon, és boldogság van. Eddig kb annyi értelme van, mint az iWiW-nek (azaz semmi). A dolog ott kezd izgalmas lenni, amikor egy kicsit elkezdjük analizálni ezt a rengeteg adatot, ami ily módon összegyűlik a Last.fm szerverein. Pár hete volt némi időm és elszórakoztam az oldallal egy keveset; ha érdekel, hogy mi jött ki, olvass tovább.

Haszprus

Önlab folytatás

©   Haszprus   |   adatbányászat bme

Volt ma tegnap félévkezdő önlabtali by adatbányászat csoport. Na megkérdeztem a tavalyi két konzulensemet, hogy bár négyest kaptam a munkámra, de szerintem azért több volt az, mint amit egy két kredites tárgy keretében elvárnak, csak rosszul ütemeztem (magyarán a vége felé kezdtem el). Mondták mindketten hogy igen, nem szokás két kreditért ennyit. A 2 kredites előző félévemhez (képajánlórendszer, u know) képest a 8-as I becslése szerint kb. 2-3x-os energiabefektetést igényel majd. 2x-essel egy gyenge önlabom lesz, 3x-ossal egy erős, szerinte.

Haszprus

Képajánló

©   Haszprus   |   adatbányászat bme fejlesztés haszprus

Bizonyos esetekben egész jól műxik. Időm nem volt alaposan kitesztelni meg ilyenek. Most ez nekem két kreditért oké volt, ennyi. Ha érdekel, itt megnézheted [update 2024-03-02: csak megnézhetted], hogy személy szerint neked mit ajánl.

Nagyjából azt érdemes figyelni, hogy az eddig letöltött képeid függvényében vajon úgy érzed-e, hogy nagyjából releváns képeket ajánl, tehát hasonló jellegűeket. Például ha tűzijátékos fotókat néztél, akkor jóeséllyel látsz további tűzijátékosokat. Ha külföldi fotókat néztél, jóeséllyel látsz további külföldi fotókat. Legalábbis ez volt a kiindulási alapfeltevésem, aztán egyáltalán nem biztos, hogy a gyakorlat ezt a feltevésemet igazolja. Ugyanis a képeket nem hasonlóság alapján ajánlja, hanem hozzád hasonló ízlésű felhasználók képnézegetési szokásai alapján. Azaz az ajánlott képek nem feltétlen kapcsolódnak egymáshoz. De azért megfigyelhető egy-két dolog, amibe most nem megyek bele…

Ha csak két képet látsz, az azt jelenti, hogy nem tud ajánlani neked a rendszer semmit. Valószínűleg nem tudja hogy ki vagy (pl. mert törlöd a cookie-kat), vagy még nem töltöttél le képet. Bizonyos bugok is vannak a userazonosítás körül, amiket még nem debugoltam (és egy darabig nem is fogom, mert nem érek rá).

  • Képajánló a Haszprus überblogon

2024. már. 02. 14:03 kivezettem ezt a funkciót. Magyarul töröltem.

Haszprus

Önálló labor @ 2.4

©   Haszprus   |   adatbányászat bme történelem

Oh yeah, elfogadták a 2.4-es önálló labor jelentkezésemet (határozottan nem volt egyszerű ügy), úgyhogy valami adatbányászatos jóságot fogok csinálni az alábbiak közül:

  • Webes adatbányászati alkalmazások
  • Webes adatbányászat ajánlattevő rendszerekben
  • Szavazó algoritmusokkal támogatott adatbányászati eljárások
  • Webanalitikai eszközök vizsgálata
  • RSS hírcsatornák adatbányászati támogatása
  • Érdekességi mutatók vizsgálata a webes adatbányászatban

Még nemtom melyik legyen, mindegyik tetszik, úgyhogy majd közelebbről belenézek a csapatmunkákba, aztán döntök. Vélemény jöhet pro&kontra, ha van.

Privacy-harcosoknak: az egyik témakörben azt kívánjuk elérni, hogy egérmozgás alapján képes legyen beazonosítani egy webhely, hogy a tíztagú családnak éppen melyik tagja ül a családi számítógép előtt (Vagy egérmozgás alapján eldönteni azt, hogy a usert mennyire érdekli amit éppen olvas.)

Haszprus

Adatbányászati alapok

©   Haszprus   |   adatbányászat fejlesztés php

Ki akarjuk bányászni egy időjárásjelentő oldalról hogy hány fok van, hány fok lesz, stb.

/**
 * $source szovegbol kibanyassza a 
 * $id id-ju div erteket es 
 * $type tipusra castolva visszaadja
 */
function get_value_by_div_id($source, $id, $type) {
   $matches = array();
   $regexp = "<div.*?id\=\"$id\".*?>(.*?)<\/div>";
   preg_match("/$regexp/s", $source, $matches);
   settype($matches[1], $type);
   return $matches[1];
}

Így pl.

$source = '... <div id="current_temps">26&amp;amp;deg;C</div>... <div id="current_rfval">28&amp;amp;deg;C</div>...'; $t = get_value_by_div_id($source, "current_temps", 'int'); $e = get_value_by_div_id($source, "current_rfval", 'int'); echo "Hőmérséklet $t fok (érzésre $e)";

A kimeneten:

Hőmérséklet: 26 fok (érzésre 28 fok).