miércoles, 5 de septiembre de 2012

Web 3.0, ¿realmente avanzamos hacia ella?


Se habla mucho actualmente de Web 3.0, se considera que luego de la revolución social que fue Web 2.0, en donde los receptores pasaron a ser productores, se podía evolucionar hacia un nuevo estado de la red.
La Web 3.0 es un cambio tecnológico en donde los objetos, redes, plataformas, sistemas operativos podrán conectarse, además esto se podrá reflejar en la realidad gracias a los proyectos de realidad aumentada y gracias a la mejora de los sistemas de búsqueda podremos encontrar lo que necesitemos usando un lenguaje natural y sin pérdida de tiempo; pero, ¿realmente nos acercamos a esta utopía?

Estoy de acuerdo que existen propuestas interesantes para mejorar la red pero no estoy aun convencido que las respuestas como web semántica o cloud computing sean las más adecuadas. Aun así es importante describir las características de la Web 3.0.

 Características de la Web 3.0

Ubiquidad Conectiva

Con ubicuidad conectiva nos referimos a poder crear un ambiente en donde los objetos de uso cotidiano estén conectados (por ejemplo el celular, el despertador, la refrigeradora, el auto, etc). Todos los objetos estarán conectados a internet y podrán interactuar con otros objetos o con personas.
http://vimeo.com/1561578
Encontraremos dispositivos de realidad aumentada que pueden ayudarnos de muchas maneras, en el trabajo, en nuestra vida social, en las clases, etc.

Proyecto escolar de realidad aumentada

Google Glass

Crítica
Con la lucha actual de la libertad en internet y la paranoia de gobiernos y corporaciones por controlar toda la información que circula, es importante tener en cuenta que si todos los dispositivos están conectados es más sencillo monitorear todas nuestras acciones, ya sea para hacer un seguimiento desde instituciones de control, como para hacer análisis de marketing, en realidad el problema es la violación de nuestra privacidad.

Google Glass Parodia
Este video es una parodia del original de google glass y, más allá de ser divertido o no, me gusta porque refleja las condiciones más normales de vida y no ese mundo idealizado que siempre se presenta en los productos comerciales.


Network Computing

Esta característica hace referencia a la interconexión entre distintos servicios online, y además a la computación distribuida.
Se intenta lograr interoperabilidad entre los servicios web, así es posible interactuar entre distintas aplicaciones y servicios web sin problemas de compatibilidad. Por otra parte la computación distribuida engloba a sistemas como los intercambios P2P o la computación en la nube (cloud computing).
Crítica
Aunque hay que tener en cuenta los términos y condiciones de uso que imponen las compañías que brindan opciones de cloud computing, por ejemplo no olvidemos lo que sucedio con Megaupload y los millones de archivos que se perdieron en la requisa de esos servidores, que por cierto no serán devueltos.

Tecnologías Abiertas

La crisis actual de los sistemas de copyright debería llevarnos a nuevos modos de desarrollo y de compartir información.
Se debería trabajar con APIs y protocolos abiertos, así como formatos de datos abiertos, por otra parte lo más sensato es trabajar con plataformas y software de código abierto, y también utilizar ciertos sistemas de licencias que protejan este tipo de trabajo como las licencias creative commons.


Lograr una web que sea capaz de comprender el lenguaje natural es uno de los mayores retos que se enfrenta. Las tecnologías que se aplican para llegar a una web semántica son diversas, sistemas de etiquetado estandarizado, algoritmos de reconocimiento de lenguaje, plataformas con aplicaciones semánticas, bases de datos asociativas, etc.
Si se logra desarrollar lo suficiente los agentes inteligentes (procesamiento natural de lenguaje, aprendizaje y razonamiento de las máquinas, agentes autónomos) es posible llegar una web más organizada y que nos permita encontrar la información que necesitamos sin necesidad de perder grandes cantidades de tiempo.

Google hacia la web semántica

Crítica
Aunque se habla mucho de lo que será la web semántica, en realidad los procesos no están tan avanzados como se suponía deberían estar en este momento, la inmensa cantidad de información sin referencias o etiquetas, los problemas de desarrollo de los agentes inteligentes y la inteligencia artificial fuerte, la cantidad de sistemas y plataformas incompatibles, son solo  algunos de los grandes problemas a los que se enfrenta si realmente se quiere llegar a la Web 3.0. Si realmente se quiere llegar a pensar en una Web inteligente es probable que se deba reconsiderar el camino por el cual estamos yendo.

Conclusión
A pesar de que los avances tecnológicos han sido bastante impresionantes en algunos campos, observamos que aún falta mucho para realmente considerar que nos encontramos en una Web 3.0, algunos pasos han sido dados pero a mi parecer es irreal decir que estamos dejando la Web 2.0, además aun no hemos descubierto todo el potencial de esta.
En todo caso no debemos apresurarnos y saltar hacia una idea que por el momento parece más un slogan publicitario que un desarrollo real.

lunes, 27 de agosto de 2012

Buscador semántico Hakia


Hakia es un buscador semántico, y con búsqueda semántica se refiere a un "proceso utilizado para mejorar la búsqueda por Internet mediante el uso de datos de las redes semánticas para desambiguar las consultas y el texto de la web con la finalidad de encontrar los resultados más relevantes en relación a la demanda del usuario." (colaboradores de Wikipedia 2012)

¿Cómo funciona Hakia?

  1. Crawling: El primer paso es establecer los sitios con información confiable recomendados por bibliotecarios. Estos se separan en distintos tópicos y también según BD (bases de datos).
  2. Feeds: Además de esto hakia se alimenta de Noticias, ciertos Blogs, y BD.
  3. Análisis de Páginas y Puntuación: Luego de la recolección se analiza las páginas usando ciertos algoritmos semánticos y se realiza un test de lenguaje, se comprueba si es objetable el contenido, los links y el texto, la calidad de los links y la calidad del contenido. Una vez puntuada el sitio se procede a extraer párrafos y se los guarda en una BD.
  4. QDEXing: El algoritmo de hakia revisa las páginas línea por línea extrayendo todas las posibles consultas que se puedan realizar. Una vez realizado este proceso se realiza un análisis morfológico que transforma las sentencias en consultas generales y se establece que tan bien esa sentencia representa el contenido de la página completa. Con esto realizado se  extraen los conceptos claves de la página y así se puntúa las diferentes consultas
  5. QDEX Storage: Una vez realizado el QDEXing en cada página se comparan las consultas con obvias coincidencias entre varias de ellas, entonces se guarda en un archivo QDEX las distintas consultas con las referencias a las páginas según la puntuación antes establecida.

Este proceso se realiza offline, el objetivo sería realizarlo On-line

En este video están los procesos mejor detallados pero lastimosamente solo está en ingles.


Cuando se busca con Hakia lo que en realidad sucede es:

Se analiza la pregunta, haciendo la comparación con una larga lista de preguntas ya establecidas, (Cómo, Cuando, Porqué). Se analiza semánticamente la consulta y se asocian los términos claves con sus sinónimos u otras acepciones y gracias a las tablas hash se establece donde se encuentra las páginas en el QDEX Storage, entonces se retorna todas las páginas que estén acorde a la consulta y extrae párrafos relevantes, por último un algoritmo analiza estos párrafos y la consulta, y los despliega según la relevancia que tengan. Las sentencias relevantes se verán señaladas en cada párrafo desplegado.


Consultas en Hakia



Los tipos de consultas en Hakia estan dividas en 3 grupos, Surface Semantics, Deep Semantics y Regular Search.

Surface semantics contiene 3 apartados. Web, que es una búsqueda general en la Web. News solo busca en apartados de noticias. Blog limita la búsqueda a ciertos blogs escogidos.

Deep Semantics es una búsqueda más especializada y se restringe mucho más que las otras 2. Pubmed es una base de datos especializada en datos médicos. Credible se refiere a información de fuentes confiables, por ejemplo wikipedia. Galleries retorna un perfil completo sobre la búsqueda y lo asocia por categorias, por ejemplo si se busca Barack Obama tenemos como resultado su web oficial, y como categorías biografía y línea temporal,  premios y logros, discursos y frases, blogs y sitios de fans, noticias y entrevistas, etc.

Regular Search es una búsqueda que se especializa en un solo tipo de contenido por ejemplo se puede buscar solo imágenes, videos o tweets.








Video sobre el funcionamiento de Hakia, lastimosamente solo hay en ingles


Crítica
Hakia es uno de los búscadores semánticos más completos que funcionan hoy en día, aun esta de lejos de estar completo (sigue en versión beta) pero si observamos las búsquedas de Deep Semantics nos damos cuenta lo increíble que resultaría si el proceso se pudiese aplicar a la web entera, sobre todo ver los resultados de Galleries me han sorprendido muchísimo, con el ejemplo de Hugo Chavez quede más que satisfecho.

Ahora el problema es que, como se detallo en los pasos anteriores, se debe analizar completamente las páginas línea por línea lo cual lleva una increíble cantidad de tiempo y recursos, por esto sería necesaria la colaboración de muchas personas y compañias para que se pudiese llevar a cabo, pero como se sabe  los buscadores son un negocia y hay mucha competencia entre los grandes (google, bing, yahoo), esto dificulta el sueño de llegar a una web semántica.

En cualquier caso si los algoritmos semánticos mejoran, en combinación con los sistemas de etiquetado, y aportes de la comunidad se llegaran a optimizar las búsquedas enormemente, esperemos que hakia sea un primer paso para esto.

jueves, 23 de agosto de 2012

Buscadores Semánticos

Al tratar sobre la Web semántica es importante saber hasta qué punto se ha avanzado en el desarrollo de buscadores, porque si bien pueden existir muchas propuestas (nuevas ontologías, sistemas de BD con ordenamiento distinto, desarrollo de IA, etc), es importante observar cómo se integran en un buscador y si realmente este funciona.

¿Qué es una búsqueda semántica?

"La búsqueda semántica es un proceso utilizado para mejorar la búsqueda por Internet mediante el uso de datos de las redes semánticas para desambiguar las consultas y el texto de la web con la finalidad de encontrar los resultados más relevantes en relación a la demanda del usuario." (colaboradores de Wikipedia 2012)

Con relación a esta definición un buscador semántico debería ser capaz de producir mejores resultados para nuestras búsquedas en internet lo cual nos ahorraría tiempo y tendríamos disponible información más relevante. Ahora, es necesario saber si los buscadores semánticos actuales, por lo menos intentan aproximarse a la definición antes dada.

Se ha realizado una investigación más a profundidad sobre los buscadores semánticos, entre los cuáles se destacan los siguientes:


  • Duck Duck Go: es un buscador que combina tanto la búsqueda semántica con la habilidad de buscar en otros buscadores sin tener que abandonar la página principal de Duck Duck Go, utiliza Wolfram Alpha para preguntas directas como "Cual es la extensión de X país", "25*48=", además permite organizar las búsquedas por categorías.
  • Kngine: Un buscador semántico para teléfonos móviles, está calificado como una aplicación muy útil, el siguiente video es una demostración de cómo funciona. Lastimosamente no lo pude probar debido a que está disponible solo en EEUU  (y en Europa creo) por el momento.Se puede encontrar más información de cómo funciona aquí
  • Netbase: netbase no pretende crear en sí un buscador sino desarrollar la tecnología para la búsqueda y ofrecerla, aunque no es posible probarlo el video es interesante, además se puede consultar más información de su funcionamiento aquí.


  • Cognition: este es un sistema que al igual que netbase no pretende en sí crear un motor de búsqueda sino crear la tecnología para que se pueda buscar en cualquier sistema a través de un lenguaje de procesamiento natural, en otras palabras que podaos utilizar lenguaje común para realizar nuestras búsquedas. Se puede hacer una prueba de la búsqueda dentro de wikipedia.
  • Hakia: este es otro buscador semántico que tiene varias categorías de búsqueda entre las que destacan Blog, que se refiere a búsquedas solamente en Blogs; Credible, que es información veraz aunque no se sabe los parámetros que utiliza para asegurar esto; Pubmed, que se basa en la busqueda dentro de revistas de ciencias de la vida y libros online.
  • SenseBot: este buscador semántico no es muy completo, es inferior en calidad y presentación de  la información frente a los demás (como DuckDuckGo) aun así sus resultados no son mediocres, además añade una función luego de realizada la búsqueda se obtiene un número de palabras claves que podrían ayudar a mejorar la búsqueda.
Existen muchos más pero a mi parecer estos son los más relevantes frente a búsquedas generales, en particular Duck Duck Go y Hakia se han ganado ya un puesto entre mis favoritos, tanto así que duck duck go es mi página principal de búsqueda (aunque sigo utilizando Google para comparar resultados). Esto lo hago sobre todo por los problemas que afrontan varias páginas en Google debido a la penalización en posición que han sufrido varias páginas por "infracciones", algo en lo que no concuerdo para nada.

Referencias

Colaboradores de Wikipedia. Búsqueda semántica. Editado por La enciclopedia libre. Wikipedia. 15 de marzo de 2012. http://es.wikipedia.org/w/index.php?title=B%C3%BAsqueda_sem%C3%A1ntica&oldid=54595324 (último acceso: 20 de Agosto de 2012).

(último acceso: 20 de Agosto de 2012).

martes, 14 de agosto de 2012

Videojuegos y Teorías de aprendizaje

A pesar de que a la teoría de videojuegos no se la pueda incluir como una teoría de aprendizaje me gustaría en este post plantear la fuerte relación que existe entre los videojuegos y el aprendizaje.

En la mayoría de círculos aun se considera a los videojuegos como agentes externos a la educación y puramente triviales, pero en los últimos años estos han penetrado tanto en todos los niveles posibles de la sociedad que es imposible no tomarlos en cuenta.

Lastimosamente hoy en día la mayoría de los juegos que pueden encontrarse para educación se basan en características del conductismo, esto incluye a juegos enormes dentro de los cuales  se han realizado muchos estudios académicos como World of Warcraft (un estudio interesante sobre su relación con la filosofía se puede encontrar en el libro "World of Warcraft y la Filosofía". Aunque este tipo de juego por la extensión de su comunidad ha logrado evolucionar no se puede decir lo mismo de muchos otros.

Antes de continuar les recomiendo observar el video de Jane Mcgonigal sobre lo que pueden aportarnos los videojuegos.


Ahora, pasando a las relaciones que existen entre las teorías del aprendizaje y los videojuegos, comencemos por las tradicionales.

  • Conductismo: Como se dijo antes la mayoría de los juegos tiene una lógica conductista, esta puede verse complementada por otros atributos del juego, pero aun así mantiene como principal actor al proceso conductista. Existen muchos ejemplos a los que podemos acudir, en la mayoría de los juegos uno debe cumplir un objetivo específico este puede ser llevar un objeto de A a B, y/o en X tiempo, recolectar X, repetir cualquier tarea tantas veces, etc. Se observa que en este comportamiento hay claramente un enfoque conductista sobre la tarea a realizar.
  • Cognitivismo: EL resolver rompecabezas son un claro ejemplo de la aplicación del cognitivismo en ciertos juegos de aprendizaje, en estos se debe resolver un acertijo siguiendo las mecánicas del juego ya sea tan sencillo como un rompecabezas para niños de juntar piezas o algo más complejo como la búsqueda de un criminal famoso como en el juego ¿Dónde está Carmen Sandiego?
  • Constructivismo: El aprendizaje constructivista en los juegos se ha beneficiado enormemente en este último tiempo con la aparición de los MMORPG (Juegos de Rol Multijugador Online Masivos), estos nuevos ambientes de socialización han probado ser un terreno fértil para la investigación educativa y varios proyectos se han llevado a cabo en mundos virtuales como World of Warcraft y Second Life, en donde la construcción del conocimiento mediado por estas nuevas formas de socialización es un aporte enorme a esta nueva manera de observar los videojuegos.

Además de las teorías tradicionales se puede encontrar las ligazones que existen con otras teorías del aprendizaje, y debido a que estas nuevas están adaptadas al medio digital la relación se establece muy fácilmente.

  • Microlearning: Muchos de los tutoriales e introducciones a los videojuegos aprovechan de un tipo de microlearning en el que a través del movimiento, de las acciones, interacción con el mundo, y demás, se enseña por ejemplo los controles básicos, los objetivos, la mecánica del juego y varias otras pequeñas instrucciones a través de videos, textos o  animaciones, que pueden ser tanto dentro como fuera del juego -en la web, o incluso a través de Apps en un dispositivo móvil, estas "intervenciones" suelen tener duraciones muy cortas entre 2 y 5 minutos.
  • Conectivismo: Si se toma a los MMORPG como ejemplo se puede mostrar como las relaciones que se establecen entre los participantes muchas veces superan los límites del juego y crean nuevos tipos de relaciones fuera que dan espacio a un aprendizaje que va más allá de la simple relación entre jugadores. En este caso las conexiones que se establecen son más importantes que el contenido y lo sobrepasan.

Así los videojuegos han incursionado en muchos aspectos educativos y se observa cómo se han adaptado a muchos de los paradigmas, incluso mezclando en un mismo ambiente características de diversas teorías.
Finalmente me gustaría terminar con una crítica a lo que se denomina gamificación, que se ha convertido en un término muy usado, el problema surge de la aproximación empresarial de este concepto que si se lo revisa a fondo no termina por aportar nada valioso a los videojuegos, y lo único que pretende es una masificación de la lógica básica de ciertos juegos en ámbitos predominantemente empresariales o en algún otro campo como podría ser la educación. Sobre esto recomiendo dos artículos de Ian Bogost, Gamification is Bullshit y Variety in Videogames.

lunes, 13 de agosto de 2012

Web 3.0 o Web semántica?

Hace poco aun se estaba hablando de la web 2.0, ahora se plantea la cuestión de si estamos entrando en una web 3.0, o lo que algunos consideran será la Web semántica, pero si la web 2.0 hacía referencia a transformarnos en productores y no solo meros consumidores, ¿a qué hace referencia la web 3.0 o web semántica? La web 3.0 haría referencia a la manera en la que el contenido de la web esta organizado a como se realizaran las búsquedas en dicho contenido, haciendo que estas comprendan el lenguaje y nos ofrezcan mejores resultados. Hace varios años cuando se dieron los primeros pasos en el desarrollo la inteligencia artificial se creía que a continuación venían una serie de adelantos -como la creación de verdaderos agentes inteligentes- que al fin y al cabo nunca llegaron, y con esto se frustraron muchas aspiraciones. Una de estas tantas aspiraciones que se buscaban era la resolución a los problemas de búsqueda, que en ese entonces eran mucho más deficientes que hoy en día. Aunque Google cambio completamente las búsquedas en internet, aun siguen siendo deficientes en muchos sentidos, y el tiempo que realmente gastamos en encontrar información valiosa es mucho mayor las décimas de segundo que google "tarda" en buscar.




Por ahora se apuesta por, lo que se podría llamar, etiquetación del contenido, sea a través de XML, RDF o cualquiera de estos lenguajes, que consiste en añadir metadatos a los contenidos para que puedan luego ser identificados por cualquier tipo de aplicaciones en internet. El problema es que por el momento la mayoría de los datos en internet no se encuentran etiquetados; el establecer un estándar para ello -que se cumpla por cierto- y ponerlo a funcionar es una tarea muuuuuuuuy larga y puede que al final la metodología, que aun se basa en el paradigma de orientación a objetos, no sea la más adecuada para la organización de contenido. Un video de la propuesta de metaweb, empresa adquirida por google para mejorar sus búsquedas y que refleja exactamente la propuesta de orientación a objetos.


 


Aun así la competencia de los gigantes (google, bing, yahoo), en cuanto a mejorar las búsquedas, y el aporte de la comunidad, ha logrado realizar algunas mejoras en cuanto a los procesos de búsqueda. Por el momento las pruebas que he realizado en buscadores semánticos como Clusty y Swoogle dan pobres resultados, así mismo sucede en la mayoría de búsquedas en Bing. Por el momento buscadores de conocimiento como Wolfram Alpha y google, con las mejoras que ha introducido a partir de la compra de metaweb en 2010, parecen ser las mejores alternativas, por ejemplo el sueño seria este:




Si prueban esto en la versión de EU de google pues se nota queel reconocimiento de voz aun esta lejos de ser competente (debido también a mi pronunciación XD), así que no pude ser capaz de lograr ni un reconocimiento completo de una frase.

Por otra parte hay iniciativas más tentadoras como la base de conocimientos que se encuentra construyendo google



Esta opción solo esta disponible en la versión de EU de google y es interesante probarla, he realizado dos búsquedas, una sobre marte y otra sobre una amiga y los resultados son decentes, aunque todo este procesos esta muy lejos aun de poder realizar búsquedas complejas.





Por el momento parece que existen progresos que nos hacen soñar con un tipo de web que comprenda realmente lo que le pedimos que busque pero aun así estas aspiraciones parece que no llegaran en poco tiempo.

Les recomiendo ver este último video sobre Wordnik que es un nuevo estilo de diccionario, en el que se toma en cuenta los usos de las palabras en contexto más que una referencia restringida como sería, por ejemplo, la real academia de la lengua. Esto me parece muy importante en la Web semántica debido a que dependiendo de los significados de una palabra se podrían encontrar distintos tipos de resultados según sea la persona que los busque, tal como plantea el video citando a Wittgenstein "El significado de una palabra es su uso en el lenguaje"