26 janvier 2011

I ran lately into serious questioning about my CD library of classical music. If I decide to expatriate myself for a few years, should I take away all my CDs? Isn’t there any clever means to access them from anywhere? The first option would be to take them all with me. No way, there are too many, and a long trip is the best way to break some of them.

I hence have to transfer their content onto my computer. As they contain classical music, most of which corresponding to legendary recordings, I don’t want to spend hours transferring their content to get lousy MP3 files at the end. First of all, MP3 is patented, meaning it is not free: in our era in which copying a computer file is over-simple, it’s a non-sense to patent a format. Second, MP3 is lossy, meaning it’s not possible to recover all of the data: quality is lower than on the initial CD. Hopefully, a free, lossless format exists, FLAC, which is supported by numerous audio and computer systems (laptops, media players, smart phones…): the long-term usability of my FLAC files should therefore be much better.

Ok, for each of my CDs, I thus have to transfer their content into a FLAC file, which is straightforward with Rhythmbox, an equivalent of iTunes or Windows Media Player but… free, available by default on Ubuntu. But here lies another difficulty. Transferring a CD onto a computer requires the user to enter all the music details: artist, title, tracks…, a painly process. But here again, a great tool can help us. Rhythmbox automatically searches an online database with the technical features from the input CD and, if there is a match, retrieves automatically the music details.

This online database, named MusicBrainz, aims at gathering reliable information about all CDs worldwide thanks to massive collaborative efforts (a kind of Wikipedia but exclusively for music, according to its founder). I therefore decided to join this project (although it is open-content and not free-content). If one of my CDs is not part of the database, I insert its music details, therefore allowing everyone to freely access them after me. And if the CD is already inserted in MusicBrainz, Rhythmbox automatically retrieves its details, such as with this one, the Mozart Requiem directed by Karl Böhm in 1971.

And by the way, I also have the possibility to keep online a list of my CD collection, which is quite nice. If I lost a CD I love or if I want to buy another copy of it to make a gift to someone, I’m sure to retrieve all its details in order to buy it again.

Finally, I know have to focus on the fact that my computer hard-drive is rapidly filling up, hell yes. FLAC being lossless, it generates big files, smaller than whole CDs of course, FLAC cleverly compresses the audio data, but still! Instead of buying an nth external hard-drive, which is a simple solution but prone to disaster if I loose the given hard-drive, I am thus thinking of renting hard-drive space to OVH. But it’s another story.


Just waiting for the future to come?

16 janvier 2011

Prediction is very difficult, especially about the future.

Niels Bohr

Ok, but:

The best way to predict the future is to invent it.

Alan Kay

Why should we draw a line between a researcher (describe, explain, predict) and a social actor (involve, convince, transform)? Aren’t they the same (recombine, share and enjoy)?!

« Learning about nature through provisional knowledge » as universal legacy

11 janvier 2011

Science is one of the pillars of civilization and liberal democracy, as that eminent philosopher of science, Karl Popper, convincingly argued. It is, he said, « one of the greatest spiritual adventures man has yet known ». Because science rejects claims to truth based on authority and depends on the criticism of established ideas, it is the enemy of autocracy. Because scientific knowledge is tentative and provisional, it is the enemy of dogma. Because it is the most effective way of learning about the physical world, it erodes superstition, ignorance and prejudice, which have been at the root of the denial of human rights throughout history, whether through racism, chauvinism or the suppression of the rights of women.

Dick Tavern, Nature v459, 2009



Yet it is important, when exposing such a view, to distinguish between science and its consequences (which are not « science » although they can be studied scientifically). I know some people  (me included) who acknowledge that things start to complicate once knowledge derived from science exits the inner circle of so-called « appointed scientists » to enter mass media, political cenacles, private companies, school/university teaching, etc, and this for numerous reasons (divergent interests, lack of time, environment pressure).

However, the reverse is true also. Miseries and vagaries of scientific understanding among people should not let us forgot that science is about going on doubting, aware of our ignorance but determined to expand our knowledge, ever and ever, through experiments and conceptualizations. And the words of Taverne, e.g. « tentative and provisional », are very much appealing to me. In the same vein, Richard Feynman once said that « science is the belief in the ignorance of experts » (talk here).

The challenge is all about conciliating science and its consequences, and being aware of what science is should not be too damaging.

Why writing all this? Because this topics was quite hot a few weeks ago…

Utiliser LaTeX pour une thèse en SHS franco-vietnamienne

3 janvier 2011

De tout temps, des artisans ont produit de magnifiques objets, mais tous les métiers ne s’y prêtent pas. Certaines professions sont nettement plus « scribouillardes » que d’autres, notamment dans le monde académique où l’on produit (est censé produire) des articles à la chaine.

Ces idées, résultats, interprétations, discussions, conclusions, méritent d’être diffusés avec une mise en page respectant autant que faire se peut les règles typographiques en vigueur. De plus, à notre époque numérique, il est important de s’assurer de la pérennité de ces documents académiques, c’est-à-dire de leur préservation sous une forme permettant de les convertir facilement à l’avenir.

Dans un un tel contexte, nous pouvons donc tous nous réjouir du travail de Donald Knuth à qui nous devons, entre autre, l’existence de TeX, un système de composition de documents. Au passage, remercions également Leslie Lamport qui a grandement facilité l’utilisation de TeX en créant LaTeX. Mais passons plutôt aux aspects pratiques…

L’intérêt de LaTeX réside dans le fait qu’il exige du rédacteur de se concentrer sur la structure logique de son document, son contenu, tandis que la mise en page du document est laissée au logiciel lors d’une compilation ultérieure. LaTeX sépare ainsi en deux phases la forme du contenu. Ce système est libre, gratuit et multi-plateforme (en gros, il fonctionne sur GNU/Linux, Windows et Mac).

Ce système est utilisé relativement fréquemment par les chercheurs en sciences « naturelles », mais très peu par les chercheurs en sciences humaines et sociales. Dans la suite de ce billet, je présente un exemple de comment écrire une thèse mêlant français et vietnamien pour en convaincre quelques uns de sauter le pas.

Commencez par enregistrer dans les favoris de votre navigateur l’adresse du wikibook sur LaTeX,, et téléchargez-le au format pdf afin de ne pas être bloqué si vous n’avez pas de connexion internet. Puis, lisez la première partie intitulée « Premiers pas ». Une fois cela fait, vous êtes prêt à écrire votre thèse en LaTeX !

Créez un répertoire « thèse_latex » sur votre ordinateur à l’intérieur duquel vous créez un document texte « fichier_maitre.tex ». C’est ce fichier que vous compilerez afin d’obtenir votre thèse au format pdf. Comme un tel document est généralement très gros, surtout en SHS, il est pertinent de créer un fichier « chapitre1.tex », un fichier « chapitre2.tex » et ainsi de suite pour chaque chapitre. Le fichier maître se chargera d’inclure le contenu de ces fichiers lors de la création du pdf final.

Voici le fichier maître, les lignes commencées par « % » étant des commentaires:

% !TEX encoding = UTF-8 Unicode

% sous Mac, pour l'antislash, faire Alt + Maj + /
% sous Mac, pour l'accolade, faire Alt + ( ou )
% sous Mac, pour le crochet, faire Alt + Maj + ( ou )
% sous Mac, pour le le tilde, faire Alt + n

% définir le format des pages, la taille de la police et le type de document

% package pour l'encodage des langues

% package pour les liens hypertexte et les propriétés du pdf
 pdfauthor={M G},
 pdftitle={Ma thèse},
 pdfkeywords={géographie, urbanisme},

% package pour inclure des images

% package pour inclure un document pdf à l'intérieur du pdf final

% package pour faire un index

% package pour faire un glossaire
% (on peut aussi rajouter l'option "acronym" pour avoir une liste d'acronymes)
\newglossaryentry{sample}{name={sample}, description={a sample entry}}
% à terme, on peut regrouper toutes les entrées dans un seul fichier et faire un "include"



\title{Ma thèse}
\author{M G}


% inclusion du contenu du chapitre 1

% inclusion du contenu du chapitre 2

% créer l'index

% créer le glossaire

% créer la bibliographie
\nocite{durand_villes_1995}   % ajout à la bibliographie sans besoin d'être cité dans le texte lui-même
\bibliographystyle{plain-fr}   % spécifie le style selon lequel la bibliographie va être représentée
\bibliography{Mabibliotheque.bib}   % spécifie le fichier au format "bibtex" dans lequel se trouvent les références bibliographiques

% insérer la table des matières



Voici le contenu du fichier « chapitre1.tex »:

% !TEX encoding = UTF-8 Unicode

\chapter{Voici mon titre de premier chapitre}

\section{Et voici ma première section}

\subsection{Ainsi que ma première sous-section}

Salut, voici un premier essai de lettres accentuées: é à ç. Et voici du remplissage en latin: Legi, Patres colendissimi, in Arabum monumentis, interrogatum Abdalam 1 Sarracenum, quid in hac quasi mundana scaena admirandum maxime spectaretur, nihil spectari homine admirabilius respondisse. Cui sententiae illud Mercurii adstipulatur: Magnum, o Asclepi, miraculum est homo.

\subsection{Deuxième sous-section}

Maintenant un peu de vietnamien: \foreignlanguage{vietnam}{đưỡng lô ghè}. Puis un terme à mettre dans l'index: toto\index{toto}. Mais cela peut également être un ensemble de mots en vietnamien:
<pre>\foreignlanguage{vietnam}{đưỡng lô ghè}</pre>
\index{\foreignlanguage{vietnam}{đưỡng lô ghè}}.

\section{Deuxième section}

Horum dictorum rationem cogitanti mihi non satis illa faciebant, quae multa de humanae naturae praestantia afferuntur a multis: esse hominem creaturarum internuntium, superis familiarem, regem inferiorum; sensuum perspicacia...

% insertion d'une figure
\caption{Le marché}

Magna haec quidem, sed non principalia, idest quae summae admirationis privilegium sibi iure vendicent. Cur enim non ipsos angelos et beatissimos caeli choros magis admiremur?

% commande pour ajouter un espace vertical

Je vais maintenant testé l'ajout d'un terme dans le glossaire, commençons avec \gls{sample}. Cela a l'air de marcher. Rajoutons un peu de vietnamier pour rigoler encore: \foreignlanguage{vietnam}{đưỡng lô ghè}.

Et voici le contenu du fichier « chapitre2.tex »:

% !TEX encoding = UTF-8 Unicode

\chapter{Deuxième chapitre}

\section{Première section}

Voici une entrée pour le glossaire: \newglossaryentry{Toto_1}{description={un toto qui rit bien}}. Et maintenant une citation bibliographique: \cite{hue_litteratures_1999}.

\section{Deuxième section}

Mais n'oublions pas les listes:
\item Toto1: bciovzgiuzbe
\item Toto2: cnfivgu

Enfin ajoutons une note de bas de page\footnote{toto}, et une deuxième\footnote{\cite{hue_litteratures_1999}}, avec une référence cette fois.

Sed non erat paternae potestatis in extrema fetura quasi effeta defecisse; non erat sapientiae, consilii inopia in re necessaria fluctuasse; non erat benefici amoris, ut qui in aliis esset divinam liberalitatem laudaturus in se illam damnare cogeretur.

Et enfin voici le fichier de bibliographie au format Bibtex:

% !TEX encoding = UTF-8 Unicode

 address = {Paris},
 series = {Histoire littéraire de la francophonie, {ISSN} 1258-0368 ; {1999Universités} francophones, {ISSN} 0993-3948},
 title = {Littératures de la Péninsule indochinoise},
 isbn = {{2-86537-968-X}},
 abstract = {{AUF} = Agence universitaire de la francophonie. - Coll. principale : Universités francophones. - 9782865379682},
 publisher = {Ed. Karthala},
 author = {Bernard Hue and {Pierre-Richard} Féray},
 year = {1999},
 keywords = {24288, Francophonie -- Histoire, French language -- Indo China, Indo China -- Literature, Indochine -- Dans la littérature, Indochine -- Littératures, Literature -- Indo China -- 19th century, Literature -- Indo China -- 20th century, Littérature francophone -- Histoire et critique}

 title = {Villes et urbanisation au Vietnam, une esquisse d'état des lieux bibliographique},
 volume = {2},
 number = {31},
 journal = {Péninsule},
 author = {Frédéric Durand},
 year = {1995},
 pages = {141--162}

Avec cet exemple, nous aurons vu à peu près toutes les bases nécessaires pour écrire sa thèse avec LaTeX: inclusion de documents, bibliographie, index, glossaire, images, notes de bas de page, etc. Le pdf final ressemble à ça: pas mal, non ?

Pour aller plus loin, personnaliser la mise en page, ajouter des annexes, le mieux est de farfouiller dans le wikibooks ou sur le site des tuteurs de l’ENS. Et puis on apprend en essayant… A noter le package « classic thesis » qui permet d’obtenir une belle mise en page sans beaucoup d’efforts (disponible ici).

