Aquí podeu trobar les presentacions de cada setmana (Weekly report) i les demostracions (notebooks) per tal de fer el seguiment i veure com el projecte va avançant:
Progres report (slides) | Demo (Notebook) |
---|---|
Session 3 | Feature Extractor |
Session 4 | Random system: 1 build_database 2 get_features 3 classify 4 rank |
Session 5 | First Search Engine: Feature Extraction Rank |
Session 6 | Search Classification |
Session 7 | Features Search Classification |
Exam | [Features] [Search] [Classification] |
Som el grup 101.1 de l'assignatura de GDSA (Gestió i Distribució de Senyals Audiovisuals), format per:
Albert Altarriba
Cristian Camps
Marc Lladó
Carlos Manso
Sergi Santana
Mira els nostres perfils de Linkedin:
L'App que estaves esperant...identificar un edifici mai havia estat tan fàcil!
Mai t'ha passat quan viatges que veus un edifici, i tot i desconèixer què és i què representa el fotografies?
What a Building App! està pensada per fer la vida més fàcil a aquelles persones que fagin turisme. Treu el teu smartphone o tablet i fotografia edificis emblemàtics de Terrassa!
De moment a Terrassa però...
Per el moment, l'aplicació reconeix edificis emblemàtics de Terrassa mitjançant un smartphone o tablet. Però està pensat ampliar-la a tot el món.
Animem a la gent a fer fotos sense parar i etiquetar tot allò que vegin. Així tothom tindrà més informació dels edificis i s'estalviarà temps.
UPC Terrassa
Estudiants del grau en Enginyeria de Sistemes Audiovisuals a la Universitat Politècnica de Terrassa.
El Projecte
Ens pots seguir al nostre repositori: Repositori del What a building App!
Recentment hem dissenyat un logo que ens representi com a grup per tal de ser més visuals i capti l'atenció del públic:
A nosaltres ens va tocar fer les fotografies a dos edificis emblemàtics de Terrassa, a més d'altres fotos de qualsevol edifici que seria calificat com a desconegut. Es repartirien així:
- 50 fotos al Mercat de la Independencia
- 50 fotos al Museu de la Ciència i la Tecnologia- MNACTEC
- 50 fotos a altres edificis -->categoria desconeguts
A la primera sessió a més de les fotogries, també vam crear el primer script del projecte. Aquest consistia en trobar els punts d'interès d'una imatge. L'objectiu del projecte és que quan consultem una imatge sobre un edifici, ens indiqui a quin correspon i mostri una llista amb els que més s'hi assemblin.
El primer script que vam fer buscava els punts d'interès sobre una imatge, d'aquesta manera més endavant és com identificariem cada edifici quan féssim una consulta.
Resultats del primer script:
Per desenvolupar el projecte, utilitzem l'editor Enthought Canopy i el llenguatge Python per programar. Llibreries com opencv i scikit-learn, entre d'altres, són utilitzades per dur a terme els nostres scripts.
Ara ja tenim el Feature Extraction completat. Per a això hem hagut de crear noves funcions: get_local_features, train_codebook, get_assignments i build_bow. Amb això extreiem els descriptors per cada imatge, els ajuntem i entrenem el codebook. D'aquesta manera trobem les centroides i fem les assignacions per train i validació i creem un vector BoW (Bag of Words). Per tal de realitzar la tasca ens hem ajudat de les llibreries Sklearn.KMeans (.fit() method) i Scipy.cluster.kmeans.
Al final del projecte hauriem de tenir dos productes:
- Image Classifier
- Visual Search Engine