UNAM
16 de diciembre de 2018
II
II
¿Cómo ves?
Inicio » Número » Índice 24 » Así funciona… Internet
imprimirpdfmenosmas

Así funciona… Internet
Digital Stock

Así funciona… Internet

José Ricardo Ciria Mercé

¿Qué hay detrás de ese clic que nos permite alcanzar información almacenada en villahermosa o en madrid?, ¿cómo sabe mi computadora exactamente dónde encontrar la información que le he solicitado y no hay confusión entre las miles de peticiones que están ocurriendo en ese preciso momento?

Interconección, redes, Inter-networking, o la cada vez más familiar Internet es una "red de redes" que une a millones de computadoras en miles de ciudades y cientos de países y que crece en forma vertiginosa. A través de Internet se puede tener acceso a diversos servicios como el correo electrónico, para enviar y recibir mensajes; el ftp, mediante el cual podemos transferir archivos y programas desde o hacia computadoras distantes; telnet, con el que podemos trabajar directamente con equipos localizados en cualquier parte del mundo; pláticas o chats y literalmente millones de páginas o sitios web. La World Wide Web (telaraña mundial), www o simplemente web es uno de los servicios en Internet, pero sin duda el más popular, debido a que resulta muy sencillo manejar los programas que permiten recorrerla: los navegadores como Netscape Navigator e Internet Explorer.

Entre protocolos

El proceso de obtener una pagina web es, en principio, similar al de llamar por teléfono a una compañía y solicitar que se nos envíe por fax o por correo ordinario información de sus productos o servicios. Esta forma de interactuar es conocida como cliente-servidor, es decir, una parte pide (el cliente) y la otra parte proporciona el servicio (el servidor). Cuando navegamos por la red somos clientes de uno o muchos servidores.

El ponerse de acuerdo en cuanto a la forma de envío y recepción se conoce como protocolo. Internet utiliza muchos de ellos, pero dos son esenciales: el protocolo de control de transmisión o TCP (del inglés Transmission Control Protocol) y el protocolo de Internet o IP (Internet Protocol), a los cuales se suele hacer referencia conjuntamente como TCP/IP. La mayoría de los servicios disponibles en Internet (correo, ftp, telnet, etc.) basan su comunicación en los protocolos TCP/IP.

Es importante distinguir entre los medios físicos de interconexión como líneas y equipo telefónico, fibra óptica, satélites, etc., y los protocolos de comunicación, que son básicamente convenciones entre las partes involucradas sobre cómo mandar y recibir un mensaje. Por ejemplo, en la comunicación por teléfono, el medio físico es la línea telefónica y el protocolo es el lenguaje que usamos: "¿Bueno?... ¿sí?, ¿quién habla?".

Para que las computadoras puedan comunicarse entre sí, es indispensable identificar cada una en forma exclusiva. Esto se logra mediante un número único, conocido como número IP, de la misma forma que cada línea telefónica tiene asignado un número único. Por ejemplo, el teléfono 52-7-3162388 nos ubica en México (clave 52), en Cuernavaca (clave 7) y en la línea 3162388. Los números IP son del tipo 132.248.32.2, siempre tienen cuatro partes, separadas por puntos. Sin utilizar una clasificación por país y ciudad, los números IP agrupan subredes de computadoras, permitiendo ubicarlas. De esta manera son localizables todas las computadoras que cuenten con un numero IP y les es posible intercambiar información entre ellas.

¿Qué es un Webmaster?

El webmaster es un personaje de reciente aparición en la escena del cómputo. Es el administrador y responsable del funcionamiento de un sitio www. Dependiendo de la organización en la que se desempeñe —ya sea una fábrica de zapatos, un centro de investigación, o la página del propio webmaster— es el mediador entre los autores de las páginas y el administrador del equipo de cómputo en el que se encuentran, pero puede ser también todos ellos. Normalmente tendrá que verificar que todas "sus" páginas cumplan con un mínimo de calidad y uniformidad, que no apunten (o contengan ligas) a páginas inexistentes, que su diseño sea agradable, que el tiempo de "cargado" (tiempo en que tarda en desplegar) no sea excesivo, etcétera. El webmaster es usualmente el primer contacto humano (a veces el único) entre los visitantes de un sitio web y sus creadores.

Un webmaster difícilmente puede sobrevivir sin conocimientos de al menos un lenguaje de programación (como Perl), un sistema operativo (como UNIX), del lenguaje HTML (del inglés HyperText Markup Language) para la creación de páginas web y de la programación CGI (Computer Graphics Interface). Sus actividades abarcan un amplio rango, desde el diseño de páginas y formas que deben llenar los clientes, hasta la administración de grandes proyectos, pasando por la integración de su "Intranet" (Internet de uso exclusivo interno en una organización) y por la instrumentación de programas especiales para transacciones comerciales seguras.

Paquetes y rutas de tráfico

Para que una página web, un archivo o el texto de un correo electrónico puedan viajar por Internet, primero se fragmentan en "paquetes" llamados datagramas y éstos se entregan cada uno a un mensajero diferente. Podemos imaginar a los mensajeros como repartidores que llevan en algún lugar muy visible la dirección (número IP) del destinatario del datagrama y la del remitente.

El protocolo encargado de fragmentar los mensajes en datagramas es el TCP, y en el proceso coloca en cada uno la "etiqueta" que indica en qué orden deberán ser unidos al llegar a su destino. El protocolo IP, por su parte, coloca las direcciones del destinatario y del remitente.

El mensajero inicia su marcha independientemente de los otros mensajeros que llevan datagramas del mismo correo o página web. A lo largo de todo su camino se va encontrando con guías, llamados ruteadores que, al ver el número IP (la dirección destino), le indican el siguiente tramo del camino que debe recorrer. Es como si a un viajero se le fuera diciendo qué calle seguir, dónde dar vuelta, o cuál transporte público tomar, dónde bajarse y en qué dirección caminar después.

Los ruteadores son grandes computadoras especializadas que manejan el tráfico en Internet, enviándose datagramas entre sí hasta que éstos alcanzan su destino final. Hay ruteadores por todas partes y cada mensajero con su datagrama se limita a seguir los caminos que le van indicando.

Al ver el número IP de un paquete, los ruteadores tienen que buscar apresuradamente en sus libretas de "notas" (tablas de ruteo) para decidir su siguiente destino. Por ejemplo, si la dirección es la de una computadora cercana (en un instituto de la misma universidad), el ruteador decidirá mandarla por cable, pero si está en otro país, la enviará por satélite. Los ruteadores están constantemente en comunicación entre sí, compartiendo y actualizando información.

Las condiciones del tráfico en Internet, al igual que en las ciudades, varían constantemente. Por ello los ruteadores pueden encaminar a los mensajeros a un mismo destino por diferentes vías: a veces por angostos callejones (como viejas líneas telefónicas) y otras por amplias y rápidas autopistas (como enlaces de fibra óptica), de manera que los mensajeros pueden llegar a su destino en un orden diferente al que salieron.

Este mecanismo en el que se basa Internet, es conocido como "de conmutación de paquetes" (packet-switched) y tiene la enorme ventaja de que la conexión no es única y directa como lo es en el caso del teléfono; así se impide la "monopolización" de vías o canales de comunicación, ya que los paquetes de muy diversas aplicaciones, de millones de usuarios, de miles de orígenes y destinos diferentes comparten las mismas vías de comunicación.

En la computadora destino, el protocolo TCP toma los datagramas de cada mensajero y reúne una por una las piezas del mensaje original, las ordena, verifica que no falte ninguna y las entrega al usuario. ¿Cómo se puede hacer esa verificación? Imaginemos que pactamos con un amigo (o establecemos un protocolo) al cual frecuentemente le enviamos páginas vía fax. El protocolo consiste en que en el último renglón de cada página, indicaremos, por ejemplo, el número de párrafos, el número de letras mayúsculas y el de minúsculas, el de puntos, de comas, etc. Nuestro amigo, antes de leer una página, puede verificar si hubo errores en la transmisión, contando el número de párrafos, mayúsculas, etc. y comparándolo con lo indicado en el último renglón. El protocolo TCP efectúa una revisión similar, solicitando se reenvíen los paquetes con algún defecto. Si un paquete llega satisfactoriamente, el TCP envía a su emisor un "reconocimiento2 de que se ha recibido en forma correcta.

Internet 2

La infraestructura que soporta actualmente Internet fue sorprendida por el crecimiento, tan repentino como voluminoso, del que hemos sido testigos y dificulta el uso de algunas aplicaciones, por ejemplo las de video. En 1996 más de 150 universidades estadounidenses, centros de investigación y empresas del ramo de las telecomunicaciones, iniciaron el diseño de Internet 2. Entre sus objetivos principales se encuentra el crear amplias capacidades de red, en una Internet "paralela" para el uso de las comunidades académicas en diversos países.

Resultaría aventurado especular en cuanto a las nuevas y revolucionarias aplicaciones que pudiesen desarrollarse al contar con una red de muy alta velocidad, sin embargo, ya se habla de compartir recursos escasos o costosos, de la colaboración en tiempo real de personas en diferentes ubicaciones geográficas como si estuvieran en la misma habitación (tele-inmersión), de bibliotecas digitales, laboratorios virtuales, etcétera.

Mensajeros desafortunados

En su recorrido, un paquete puede sufrir algún percance y eventualmente nunca llegar a su destino, por lo que el emisor, si después de cierto tiempo no recibe este reconocimiento, lo envía nuevamente. Uno de los percances más comunes se debe a la saturación de los ruteadores que ante un interminable desfile de mensajeros, pueden "dejarlos pasar" sin indicarles en su momento hacia dónde ir, lo que promueve que los paquetes se pierdan. Afortunadamente, está previsto el caso de que un desafortunado mensajero se quede indefinidamente "dando vueltas" entre ruteadores, sin llegar a ninguna parte. Al salir un paquete de su origen se le asigna un numero máximo de veces que puede ser guiado y cada vez que se enruta o redirecciona un paquete, se reduce en uno este valor. Al llegar a cero, el paquete se descarta, es decir, caduca. Esto puede suceder debido a varias causas. Una de ellas es que, por ejemplo, un servidor esté programado para recibir 7000 paquetes por segundo y si en un momento dado llegan 7001, el último se descarta.

Hemos mencionado que todo programa o aplicación en Internet requiere conocer el número IP de la computadora con la que se desea conectarse o comunicarse, sin embargo, a nadie le gusta recordar cosas como 132.248.32.2, por eso es más sencillo acordarse de, por ejemplo, www. ibt.unam.mx o yahoo.com.

Glosario mínimo

Ciberespacio: Término acuñado por el escritor William Gibson en su novela Neuromancer. Se utiliza para describir todo el rango de recursos de información disponibles a través de redes de computadoras.

Correo electrónico o correo-e (e-mail): Es el envío y recepción de mensajes entre personas en Internet. Estos mensajes llegan a cualquier parte del mundo en segundos, a lo sumo en minutos. Cada usuario tiene su propia dirección en Internet, típicamente en la forma "nombre@conexión". Por correo- e pueden enviarse, como anexos o attachments, archivos de texto e imagen. Un correo-e también puede enviarse en forma automática a gran cantidad de direcciones (lista de correos).

Hipertexto: Por lo general, los textos en la red contienen ligas (links) a otros documentos, es decir, palabras o frases que el usuario puede elegir y al hacerlo se despliega en la pantalla de la computadora otro documento. Pueden ser textos, imágenes o audio.

HTML (HyperText Markup Language): Lenguaje que se utiliza para crear documentos de hipertexto que se usan en la www. Los archivos HTLM están hechos para verse con un navegador.

http (HyperText Transfer Protocol): Es el protocolo para mover o transferir archivos a través de Internet. Requiere de un programa de http del cliente y otro del servidor. Es el protocolo más importante de uso en la www.

Número IP: Número de identificación de cada computadora en Internet con el formato xxx.xxx.xxx.xxx, donde xxx es un número de 0 a 255. Con el protocolo PPP, se nos asigna un número diferente cada vez que nos conectamos a la red. (Las computadoras permanentemente en red tienen un número fijo. Pero, por ejemplo, Prodigy tiene asignados varios números y te asignan un número diferente cada vez).

FTP (File Transfer Protocol): Protocolo que permite establecer servidores como depósitos de archivos con acceso remoto, abiertos al público o sólo a personas autorizadas.

Navegador (Browser): El programa que usamos para navegar en la www; los más comunes son Netscape y Explorer.

Nombre de dominio (Domain Name): El nombre único que identifica un sitio de Internet. Tiene dos o más partes, separadas por un punto. Una computadora puede tener más de un nombre, pero un nombre de dominio dado identifica sólo a una computadora, por ejemplo matisse.net y mail.matisse.net.

POP (Post Office Protocol): Protocolo usado para la recepción y manejo de mensajes en un servidor de correo-e, servidor POP de nuestro proveedor de acceso a Internet.

PPP (Point-to-Point Protocol): Protocolo usado para conectarse vía telefónica a un servidor con acceso a Internet.

Ruteador (Router): Computadora que maneja la conexión entre dos o más redes. Los ruteadores registran las direcciones de destino de los paquetes que pasan por ellas y deciden por cuál camino enviarlos.

TCP/IP (Transmission Control Protocol/Internet Protocol): Protocolo que fracciona la información en pequeños paquetes y los envía por diversos caminos en una red; los paquetes son reorganizados al llegar a su destino. Es el protocolo usado en Internet.

Telnet: Permite a los usuarios conectarse y correr programas en otra computadora (aún cuando ésta tenga distinto microprocesador y sistema operativo) a través de la red.

URL (Universal Resource Locator ): Nombre con el que se denomina a las direcciones de los sitios en la www. Típicamente una URL se ve así: http://www.matisse.net/seminars. html o telnet://well.sf.ca.us

WWW o web: Nombre con el que se denomina comúnmente a la telaraña mundial o World Wide Web. Es un sistema que permite a los usuarios de computadoras tener acceso a información de muy diversas fuentes a través de Internet. Para entrar y recorrer la www se utiliza un programa llamado navegador (browser), el cual presenta textos, imágenes e hipertextos en la forma de una página en la pantalla de la computadora.

Información obtenida en La red desenredada (http:// www.civila.com/desenredada/glosario.html) y en el Matisse’s Internet Glossary (http://glasgowonline.com/ misc/matisse.html).

Internet en México

La primera institución en ofrecer el servicio de Internet en nuestro país, y durante varios años la única en hacerlo, fue la Universidad Nacional Autónoma de México, a través de su Dirección General de Servicios de Cómputo Académico. Gracias a esta experiencia fue posible el surgimiento de los numerosos proveedores de este servicio (carriers) que existen hoy en día.

La historia de Internet en México se remonta a 1989, cuando la UNAM inició un ambicioso proyecto en materia de telecomunicaciones con la instalación de una red satelital conformada por siete estaciones terrenas para la transmisión de voz y datos, el establecimiento de enlaces de fibra óptica y la ampliación y mejoramiento de los sistemas de telefonía en el campus de Ciudad Universitaria. En 1990 se realiza la conexión a Internet, la primera en Latinoamérica. Actualmente, la UNAM es uno de los más importantes carriers del país y maneja unas 100 mil cuentas de correo electrónico.

El dominio de los nombres

Nosotros rara vez conocemos los números IP de los equipos que estamos accesando ya que siempre hacemos referencia a sus nombres. Esto es posible gracias a que existe un directorio de números IP que funciona automática y silenciosamente, el DNS o Sistema de Nombres de Dominio (Domain Name Server), que al igual que el directorio telefónico relaciona nombres con números. En una sesión con nuestro navegador, podemos efectuar decenas de consultas a esta base de datos que es, por cierto, extraordinaria. Se encuentra distribuida en miles de máquinas que prestan ese servicio, que buscan coordinadamente entre millones de números IP y reciben miles de millones de consultas diariamente. Su contenido cambia en forma constante: nuevas máquinas, cambios de nombres, etc. Es sin duda la base de datos más consultada del planeta y con el mayor número de personas dedicadas a su mantenimiento y actualización, todo para nuestra comodidad.

Probablemente la próxima vez que envíes un correo o entres a una página podrás imaginarte (quizá mientras esperas a que ésta se despliegue) que el DNS buscara la dirección IP a la que has hecho referencia, TCP/IP fragmentará y enviará (o reenviará) y recibirá uno a uno tantos paquetes como sea necesario, decenas o cientos de ruteadores los guiarán en una y otra dirección hasta que todos hayan sido enviados o recibidos sin errores.

José Ricardo Ciria Mercé es ingeniero mecánico y maestro en ciencias de la computación. Actualmente es encargado de la Unidad de Cómputo del Instituto de Biotecnología de la UNAM.

En ediciones anteriores

Facebook Twitter Google+ YouTube

suscripción Antología Nuestro canal en Youtube
promociones2 promociones1 promociones3
Evita el ciberbullying Nutilus
Subir