[Spiegazione della lista concatenata del kernel Linux]

Spiegazione della lista concatenata del kernel Linux

(Nota: Questa e' una copia di lavoro, ultimo aggiornamento 5 Aprile del 2005. Inviate i vs commenti.)

Introduzione:

Il kernel di Linux e' per la maggior parte scritto in linguaggio C. Diversamente da molti altri linguaggi, il C non ha una buona collezione di strutture dati precostruite di suo o il supporto a collezioni di librerie standard. Percio', probabilmente avete sentito che e' possibile prendere in prestito una buona implementazione di una lista collegata circolarmente in C dall'albero dei sorgenti del kernel di Linux.

Il file include/linux/list.h nell'albero dei sorgenti del kernel implementa un tipo ovvio, facile da usare, la lista circolare concatenata in linguaggio C. L'implementazione e' efficente e portabile -- altrimenti non sarebbe stata inserita nel kernel. Ogni volta che qualcuno ha bisogno di una lista nel kernel di linux si puo' far riferimento a questa implementazione per allineare una struttura di dati indicata. Con piccole modifiche (rimuovendo la pre-lettura hardware degli elementi della lista) e' possibile usare questa lista nelle proprie applicazioni. Una versione usabile di questo file e' disponibile qui per il download.

Alcuni vantaggi nell'usare questa lista sono:

Ovvieta' dei Tipi:
Questa lista puo' essere usata per allineare qualsiasi struttura dati si abbia in mente.
Portabile:
Sebbene non sia stata provata su ogni piattafrma si presume che l'implementazione della lista sia molto portabile. Altrimenti non sarebbe stata inserita nei sorgenti del kernel.
Facile da usare:
Dal momento che la lista ha tipi ovii come le stesse funzioni che sono in uso per inizializzare, accedere, e scorrere qualsiasi elemento disposto nella lista caricato coll'utilizzo dell'implementazione stessa.
Leggibile:
Le macro e le funzioni dell'implementazione della lista fanno il codice risultante molto elegante e leggibile.
Risparmia tempo:
Non reinvetare la ruota. Usando la lista veramente si risparmia molto tempo nell'attivita' di debug e nella ripetitivita' della creazione di liste per ciascuna struttura dati si ha bisogno di collegare.

L'implementazione di Linux delle liste concatenate e' diversa da molte altre implementazioni di liste concatenate che si possono aver viste. Usualmente una lista concatenata contiene gli elementi che devono essere collegati. Per esempio:

struct my_list{
	void *myitem;
	struct my_list *next;
	struct my_list *prev;
	};

L'implementazione del kernel della lista concatenata da l'illusione che la lista sia concatenata negli elementi che concatena! Per esempio, se si e' creato una lista concatenata di struct my_cool_list si dovrebbe fare il seguente:

struct my_cool_list{
	struct list_head list; /* kernel's list structure */
	int my_cool_data;
	void* my_cool_void;
	};

Ci sono un paio di cose da notare qui:

La lista e' dentro l'elemento dati che si vuole concatenare.
Si puo' inserire struct list_head dovunque nella propria struttura.
Si puo' chiamare struct list_head qualsiasi variabile si vuole.
Si possono avere liste multiple!

Cosi' per esempio, la dichiarazione di sotto e' anch'essa valida:

struct todo_tasks{
	char *task_name;
	unsigned int name_len;
	short int status;

	int sub_tasks;

	int subtasks_completed;
	struct list_head completed_subtasks;/* list structure */

	int subtasks_waiting;
	struct list_head waiting_subtasks; 	/* another list of same or different items! */

	struct list_head todo_list;			/* list of todo_tasks */
	};

Ecco alcuni esempi di tali liste dal kernel:

Mentre a questo punto, la struttura della lista del kernel e' dichiarata come segue in include/linux/list.h:

struct list_head{
	struct list_head *next;
	struct list_head *prev;
	}

Avendo detto questo e' probabilmente tempo per approfondire nei dettagli. Primo guardiamo come possiamo usare tale struttura dati nei propri programmi. Poi, vedremo come la struttura dati lavora effettivamente.

Usare la Lista:

Penso che il miglior modo di familiarizzare con le funzioni della lista sia semplicemente di scorrere il file cercandole qui Il file e' ben commentato cosi' che non ci dovrebbero essere problemi nella comprensione di cosa e' disponibile all'utente.

Ecco un esempio di creazione, aggiunta, cancelazione, e scorrimento della lista. E' possibile scaricare il codice sorgente qui.

#include <stdio.h>
#include <stdlib.h>

#include "list.h"


struct kool_list{
	int to;
	struct list_head list;
	int from;
	};

int main(int argc, char **argv){

	struct kool_list *tmp;
	struct list_head *pos, *q;
	unsigned int i;

	struct kool_list mylist;
	INIT_LIST_HEAD(&mylist.list);
	/* or you could have declared this with the following macro
	 * LIST_HEAD(mylist); which declares and initializes the list
	 */

	/* adding elements to mylist */
	for(i=5; i!=0; --i){
		tmp= (struct kool_list *)malloc(sizeof(struct kool_list));
		
		/* INIT_LIST_HEAD(&tmp->list); 
		 *
		 * this initializes a dynamically allocated list_head. we
		 * you can omit this if subsequent call is add_list() or 
		 * anything along that line because the next, prev
		 * fields get initialized in those functions.
		 */
		printf("enter to and from:");
		scanf("%d %d", &tmp->to, &tmp->from);

		/* add the new item 'tmp' to the list of items in mylist */
		list_add(&(tmp->list), &(mylist.list));
		/* you can also use list_add_tail() which adds new items to
		 * the tail end of the list
		 */
	}
	printf("\n");


	/* now you have a circularly linked list of items of type struct kool_list.
	 * now let us go through the items and print them out
	 */


	/* list_for_each() is a macro for a for loop. 
	 * first parameter is used as the counter in for loop. in other words, inside the
	 * loop it points to the current item's list_head.
	 * second parameter is the pointer to the list. it is not manipulated by the macro.
	 */
	printf("traversing the list using list_for_each()\n");
	list_for_each(pos, &mylist.list){

		/* at this point: pos->next points to the next item's 'list' variable and 
		 * pos->prev points to the previous item's 'list' variable. Here item is 
		 * of type struct kool_list. But we need to access the item itself not the 
		 * variable 'list' in the item! macro list_entry() does just that. See "How
		 * does this work?" below for an explanation of how this is done.
		 */
		 tmp= list_entry(pos, struct kool_list, list);

		 /* given a pointer to struct list_head, type of data structure it is part of,
		  * and it's name (struct list_head's name in the data structure) it returns a
		  * pointer to the data structure in which the pointer is part of.
		  * For example, in the above line list_entry() will return a pointer to the
		  * struct kool_list item it is embedded in!
		  */

		 printf("to= %d from= %d\n", tmp->to, tmp->from);

	}
	printf("\n");
	/* since this is a circularly linked list. you can traverse the list in reverse order
	 * as well. all you need to do is replace 'list_for_each' with 'list_for_each_prev'
	 * everything else remain the same!
	 *
	 * Also you can traverse the list using list_for_each_entry() to iterate over a given
	 * type of entries. For example:
	 */
	printf("traversing the list using list_for_each_entry()\n");
	list_for_each_entry(tmp, &mylist.list, list)
		 printf("to= %d from= %d\n", tmp->to, tmp->from);
	printf("\n");
	

	/* now let's be good and free the kool_list items. since we will be removing items
	 * off the list using list_del() we need to use a safer version of the list_for_each() 
	 * macro aptly named list_for_each_safe(). Note that you MUST use this macro if the loop 
	 * involves deletions of items (or moving items from one list to another).
	 */
	printf("deleting the list using list_for_each_safe()\n");
	list_for_each_safe(pos, q, &mylist.list){
		 tmp= list_entry(pos, struct kool_list, list);
		 printf("freeing item to= %d from= %d\n", tmp->to, tmp->from);
		 list_del(pos);
		 free(tmp);
	}

	return 0;
}

Come funziona?

Bene la magior parte dell'implementazione e' abbastanza semplice ma fine. La finezza conta sul fatto che in qualche modo possiamo ottenere l'indirizzo di un elemento contenuto nella lista (struct list_head list) dal il puntatore alla lista. Questo trucco e' fatto dalla macro list_entry() come abbiamo detto sopra. Adesso capiamo come funziona.

#define list_entry(ptr, type, member) \
	((type *)((char *)(ptr)-(unsigned long)(&((type *)0)->member)))

L'espansione della macro per l'esempio di sopra e' il seguente:

	((struct kool_list *)((char *)(pos) - (unsigned long)(&((struct kool_list *)0)->list)))

Questo e' cio' che viene confuso da molte persone ma e' piuttosto semplice e' una tecnica risaputa (vedere Domanda 2.14). Dare un puntatore a struct list_head in una struttura dati, la macro list_entry() semplicemente calcola il puntatore della struttura dati. Per conseguire questo abbiamo bisogno di capire dove nella struttura dati e' la list_head (l'offset della list_head). Poi, semplicemente dedurre l'offset della list_head dal pointer effettivo passato alla macro.

Adesso la domanda e' come possiamo calcolare l'offset di un element in una structura? Supponiamo di avere una strutura dati struct foo_bar e di voler trovare un offset dell'elemento boo in essa, questo e' come fare:

(unsigned long)(&((struct foo_bar *)0)->boo)

prendere l'indirizzo di memoria 0, e poniamolo a qualunque tipo di struttura si abbia -- in questo caso struct foo_bar. Poi, prendere l'indirizzo dell'elemento a cui si e' interessati. Questo fornisce l'offset dell'elemento all'interno della struttura. Dal momento che sappiamo l'indirizzo assoluto di memoria di questo elemento per una particolare istanza della struttura (per esempio, col modo pos) deducendo il suo punto di offset all'indirizzo della propria struttura. E' tutto . Per avere una gestione migliore di cio' suggerisco di guardare questo pezzo di programma.

#include <stdio.h>
#include <stdlib.h>

struct foobar{
	unsigned int foo;
	char bar;
	char boo;
};

int main(int argc, char** argv){

	struct foobar tmp;

	printf("address of &tmp is= %p\n\n", &tmp);
	printf("address of tmp->foo= %p \t offset of tmp->foo= %lu\n", &tmp.foo, (unsigned long) &((struct foobar *)0)->foo);
	printf("address of tmp->bar= %p \t offset of tmp->bar= %lu\n", &tmp.bar, (unsigned long) &((struct foobar *)0)->bar);
	printf("address of tmp->boo= %p \t offset of tmp->boo= %lu\n\n", &tmp.boo, (unsigned long) &((struct foobar *)0)->boo);

	printf("computed address of &tmp using:\n");
	printf("\taddress and offset of tmp->foo= %p\n",
	      (struct foobar *) (((char *) &tmp.foo) - ((unsigned long) &((struct foobar *)0)->foo)));
	printf("\taddress and offset of tmp->bar= %p\n",
	      (struct foobar *) (((char *) &tmp.bar) - ((unsigned long) &((struct foobar *)0)->bar)));
	printf("\taddress and offset of tmp->boo= %p\n",
	      (struct foobar *) (((char *) &tmp.boo) - ((unsigned long) &((struct foobar *)0)->boo)));

	return 0;
}

L'output di questo codice e':

address of &tmp is= 0xbfffed00

address of tmp->foo= 0xbfffed00   offset of tmp->foo= 0
address of tmp->bar= 0xbfffed04   offset of tmp->bar= 4
address of tmp->boo= 0xbfffed05   offset of tmp->boo= 5

indirizzo calcolato di &tmp using:
address and offset of tmp->foo= 0xbfffed00
address and offset of tmp->bar= 0xbfffed00
address and offset of tmp->boo= 0xbfffed00

Vedere anche

Si prega di dare un'occhiata alla tabella hash che usa la lista concatenata.
/sutff/src/ per il codice sorgente

TODO

Figura per spiegare list_entry() meglio
Consegnare la C Data Structures Library (CDSL) che contiene le hashtable, map ecc. per le recenzioni dei colleghi. Pensarla come l'equivalente C di Java.Util. Sintassi pulita, strutture dati preimpacchetate per rendere la propria vita col C piu' semplice!