viernes, abril 13, 2012

Jim Gray's last speech

Yesterday while surfing on the net I found a free book called "The Fourth Paradigm". The book is a compilation of papers about how data analysis can change the way science is done in many fields. The book is dedicated to the memory of Jim Gray, a technologist and ACM awarded computer science who worked many years at the research division of Microsoft. Jim Gray mysteriously disappeared at the end of January of 2007 while sailing the San Francisco Bay.

The book includes a foreword by Jim Gray, which basically is a transcription of his last speech. While reading it I found it visionary and amazingly accurate on how it predicted how the future of data analysis will evolve. Jim Gray made very good points about what has been going wrong with data for many years. For Jim, the reason why data scientists and small research centres marginalize their data analysis was the lack of good and affordable tools. Not many years ago the only thing scientists and universities had was Matlab and thousands of Excel spreadsheets to store their data. On the contrary, big research centres like CERN or NSA could afford much better tools, simply prohibitive for centres with more humble budgets.

This scenario was only 5 years ago. The situation has changed dramatically in the last years. The needs of internet companies for processing large data sets has speed up the development of more and much better tools, and as many of these developments have happened following an open-source development model, their adoption has been also massive.

It's an old story, when you build something good and lower the barrier of entry, people heavily adopt your product or technology. I personally believe that free and open-source software, and the principles these philosophies rely on, are one of the reasons why the world has changed so much in the recent years and continues doing it even at a faster pace.

Data is a game changer. Ten years ago I couldn't believe they will ever be such a good translator as Google Translate, a translator based on statistical translation. The algorithms have not improved much, what has changed is our capacity to store more and more data and process it in meaningful ways. As John More amusingly shows in his talk, What's a career in big data?, more data leads to better results.

Today, large and medium companies are adopting open-source solutions for storing, processing and understanding their data. Tools that didn't exist 5 years ago. On the other hand, the world is turning into a big playing-field of emitters and consumers of information, of people interconnected. We consume tons of information everyday but also produce a big chunk that others consume.

Jim Gray, cleverly points out that is still amusing to think the way scientists publish their work nowadays. Years of research are summarized in a 8 page article published in a respected magazine like Science or Nature. But what about all the data that backs up their conclusions? Why not providing that information too and let others rethink, reuse and prove their hypothesis. Turn science into a collaborative thing, very much like free and open-source software work, very much like lots of people take things on the internet, mix them and build new things out, very much like people collaborate to build something bigger that themselves, like Wikipedia. Give people easy-to-use, accessible tools and the ability to collaborate and they will come with surprising results.

This last speech of Jim Gray is inspiring and visionary. It reminded me somehow of the famous Richard Feynman's speech, "There is plenty of room at the bottom". Jim's talk is to data analysis what Richard Feynman talk was to physics, seeing and old field in a different way. Something that eventually gave rise to a new field on its own and a new way of doing things.

Lastly, here's one excerpt of the speech that I liked very much:


"But the Internet can do more than just make available the full text of research papers. In principle, it can unify all the scientific data with all the literature to create a world in which the data and the literature interoperate with each other. You can be reading a paper by someone and then go off and look at their original data. You can even redo their analysis. Or you can be looking at some data and then go off and find out all the literature about this data. Such a capability will increase the “information velocity” of the sciences and will improve the scientific productivity of researchers. And I believe that this would be a very good development!"

sábado, abril 07, 2012

Lo que he aprendido sobre monedas

El enero pasado me pusé a ordenar mi colección de monedas. Realmente no es que sea un apasionado numismático, pero cada vez que salgo fuera siempre me gusta quedarme con unas pocas monedas como recuerdo. Así, he ido acumulando una desordenada colección de monedas durante años y al fin me decidí a clasificarla y archivarla.

Antes de comenzar tan árdua tarea busqué información sobre numismática. Típica guía de cómo ordenar tu colección, que si cartoncitos donde meter las monedas, archivadores, cómo limpiar las monedas, pinzas, etc. Al final todo es más simple de lo que parece, basta con unos cartones de distintos tamaños, unos archivadores de plástico y lavarse las manos antes de manipular las monedas. De todas formas está bien leerse alguna guía para saber cómo clasificar una moneda, cómo identificar las que están en buen estado, etc.

Después de buscar por tiendas de internet los utensilios para archivar la colección acabé topando con una tienda de numismática en Vigo, Numismática Besteiro, cerca del centro.

Llegué a casa y me puse a catalogar. La verdad es que es un hobby apasionante, didáctico y prácticamente interminable. Clasificando las monedas aprendí muchas cosas que hasta ahora no conocía o simplemente había pasado inadvertidas. Por ejemplo:

  • El lado reverso de las libras esterlinas, la cruz, varía. Hay distintos motivos que celebran distintos sucesos. Por ejemplo, algunas libras celebran los reinos del Reino Unido. Hay libras escocesas, inglesas, galesas y de Irlanda del Norte.
  • Los yenes llevan el año escrito en eras japonesas. En Japón cada vez que asciende un nuevo emperador al trono, comienza una nueva era. Ahora mismo estamos en el año 23 de la era Heisei.
  • La moneda de 5 yenes es la única moneda japonesa que lleva su valor escrito en kanji. Todas las demás llevan su valor escrito en numeración occidental.
  • Durante la segunda guerra mundial las colonias japonesas usaban un tipo de moneda llamado yen militar. Cuando un país era conquistado debía adoptar como su moneda oficial el yen militar, si bien la moneda local y el yen militar convivían durante un tiempo. El yen militar no era convertible a yen de Japón. Cuando Hong Kong fué invadido por Japón en 1941 muchas familias tuvieron que convertir sus fortunas a yenes militares. Tras la derrota de Japón, el yen militar se declaró nulo.
  • El real de a 8, la moneda anterior a la peseta, fue durante siglos la moneda "oficial" del comercio internacional. Su alto contenido en plata hacía que fuera la moneda preferida en transacciones internacionales. Posteriormente la moneda podía ser convertida en una cantidad fija de plata en un banco. El real de a 8 estuvo en circulación hasta el siglo XIX, y era moneda habitual de cambio incluso en países que no eran colonia española, como por ejemplo China y colonias británicas.
  • El real de a 8 equivalía a 8 reales. Era muy difícil conseguir reales individuales fuera de las colonias españolas, pero como la moneda era convertible a plata llegaba a fragmentarse físicamente en 8 partes, equivaliendo cada una de estas partes a un real.
  • El real de a 8 fue moneda oficial durante los primeros años de historia de los Estados Unidos de América. Allí recibió el nombre de Spanish dollar. Durante mucho tiempo convivió con el dólar americano hasta que dejó de ser oficial en 1857.
  • La otra moneda que se solía emplear en transacciones internacionales, sobre todo en Europa, era el tálero austriaco, o thaler. La palabra dóllar viene de thaler.
  • El popular símbolo del dólar, $, viene de los pesos españoles. La teoría más aceptada es que el símbolo viene de la abreviación de PS, peso. La S se superponía a la P dando lugar a $. Otras teorías sostenían que la S era realmente un 8, indicando real de a 8. Otra teoría también dice que originalmente había dos rayas, que representaban la columnas de Hércules, motivo que aparecía en los reales de a 8.
Y ahí sigo, clasificando monedas y aprendiendo. Aún me quedan muchas...