weblog de David P. Toscano sobre tecnología y programación
13/10/2005
Librarse del SPAM en los weblogs
Después de unos cuantos meses aguantando la avalancha de enlaces sobre casinos, poker, black jack, ruletas, viagra, pills, drugs y demás porquería inundando los comentarios de este weblog, por fin he incluido un filtro de palabras prohibidas.
La verdad es que no es nada complicado. Si no lo he hecho antes ha sido por pura perrería (el mismo motivo por el que este año hay tan pocos posts). Pero bueno, hay que ponerse las pilas y el primer paso era acabar con el SPAM asqueroso.
Por si alguien con weblog programado "a mano" en ASP o PHP está pensando en la mejor manera de filtrar estos indeseados mensajes, he pensado en compartir el modo en que lo he programado para
DavidSite.
Lo ideal es tener una tabla en la base de datos con las palabras "prohibidas", es decir, las que una vez detectadas en el remitente del comentario, bloquearán la publicación del mismo. De este modo, esta lista de palabras puede actualizarse fácilmente mediante una panel de control si aparecen nuevos términos sospechosos.
En mi caso, antes de guardar un comentario en la base de datos, compruebo con una sentencia SQL sencilla si alguna de las palabras prohibidas listadas en la tabla está presente en la URL del comentario (si es SPAM siempre hay URL):
SELECT * FROM Tabla_Palabras_Prohibidas WHERE (((InStr(1, [URL_a_Filtrar], [Nombre_Campo], 1)) <> False))
Finalmente, sólo hay que pemitir la inserción del comentario si el resultado de esa consulta no genera ningún registro, es decir, si la URL del remitente está completamente limpia.
Hoy es el primer día que lo pruebo y por el momento va de maravilla, ya que normalmente me encuentro unas cuantas decenas de mensajes de SPAM al día.
19/03/2005
Actualización a DavidSite 1.1
Por fin he realizado algunas modificaciones y mejoras en el weblog, que tenía pendientes desde tiempos inmemoriales.
Se han solucionado algunos errores existentes en el archivo por meses y he añadido un buscador sencillo, para localizar posts rápidamente a través de un texto clave. Esta herramienta es fundamental en cualquier blog y era un fallo bastante grave no disponer de ella.
También he modificado el archivo de sindicación RSS para incluir el texto íntegro de cada post en vez de solamente un título o adelanto.
Además de todo esto he cambiado de hosting, dejando atrás una larga (y cara) relación con
Arsys para probar con la prometedora
Hostytec. De todas formas, de este asunto ya haré mención más detallada en otro momento.
DavidSite 2.0 llegará cuando me decida a hacer un rediseño visual del weblog, algo que ya me ronda por la mente desde hace tiempo y, tras leer el post titulado
"Sobre el color" de
Freak Evolution, he pensado que pronto llegará el momento.
Se aceptan sugerencias.
15/02/2005
Weblogs temáticos como negocio
Hace poco más de un mes, la blogosfera veía nacer de manos de ciertos bloggers bien conocidos una nueva e interesante iniciativa,
Weblogs SL, una empresa cuyo objetivo es "abordar de forma profesional el negocio de blogs temáticos".
Los chicos de
Weblogs SL, entre quienes se cuentan Antonio Ortiz de
Error500 y Julio Alonso de
Merodeando por la enredadera entre otros, están firmemente convencidos de que se puede llegar a generar ingresos mediante sus weblogs y no sólo en concepto de publicidad, sino también mediante el desarrollo de blogs corporativos.
Habrá que esperar a ver si tiene éxito esta valiente idea, que plantea la creación de una serie de weblogs especializados en temas concretos como su filosofía a seguir. De momento, ya han hecho su aparición los dos primeros productos de esta empresa:
xataka, un blog de gadgets y electrónica de consumo que está pegando fuerte desde el año pasado y el más reciente (de este mismo mes)
VidaExtra, un estupendo blog sobre la actualidad de los videojuegos que también tiene muy buena pinta y al que auguramos una fructífera existencia.
En mi opinión, no estoy muy seguro de que realmente sea posible dedicarse profesionalmente al mundo de los weblogs y vivir de ello, pero sí que me parece que la especialización temática en la blogosfera es la línea a seguir. Desde luego, desde el punto de vista del lector es lo más interesante, pues la calidad de los contenidos en este tipo de bitácoras sea probablemente mucho más elevada que en el caso de aquellas que hablan un poco de todo.
Finalmente, comentar que tengo en el bolsillo un par de proyectos en esta línea (weblogs temáticos) que espero poder hacer realidad en breve. El problema es que ya me cuesta mantener al día los contenidos de
DavidSite como para enredarse en otros menesteres. La solución la han encontrado en
Weblogs SL: colaboración colectiva.
02/12/2004
Selección de weblogs en PC Actual
Ayer, mientras leía el número de noviembre de la revista
PC Actual, descubrí una sección muy interesante: una selección especial de weblogs realizada por los redactores de la revista, basándose en su originalidad/creatividad o en la calidad de sus contenidos.
Y lo cierto es que hay varios conocidos de la blogosfera. Entren los más famosillos que mencionan se cuentan los reputados
Escolar.net y
delavegaBlog. Pero la parte que más me ha gustado es la inclusión de un apartado sobre weblogs de temática relacionada con internet y las nuevas tecnologías.
En este apartado se mencionan destacadamente el weblog de
Microsiervos, uno de los mejores actualmente en mi opinión, así como el de
Tintachina, otro de los conocidos. Después de estos dos, se detalla una pequeña lista de weblogs de la misma temática, entre los que se encuentran:
código escritoMemorias de un geekLa pastilla rojaALT10407bytes...
Cómo mola que te mencionen en una revista de estas características, ¿verdad? Bueno, enhorabuena a los privilegiados y a continuar con esa calidad de contenidos y diseño.
25/08/2004
DFL: el blog de los peores atletas de Atenas 2004
El canadiense Jonathan Crowe ha tenido otra brillante idea para continuar popularizando el uso de los weblogs.
En su original bitácora
DFL (Dead Fucking Last), se clasifica a los LPF (Last Place Finishers) de las actuales olimpiadas de Atenas, es decir, aquellos que terminan en último lugar las pruebas en las que participan.
Hay una tabla en la que se muestra el número de deportistas de cada país que han conseguido este nada honroso logro, que ensalza a la máxima expresión aquello de "lo importante es participar".
Llama la atención que, en la lista de 86 paises con participantes que han quedado últimos, no aparece España. Eso significa que ninguno de los nuestros es el peor en ninguna de sus categorías. Por si sirve de consuelo...
12/05/2004
Cubos de Rubik y blogs

El otro día leyendo un
post en el
blog de Hermann me acordé de que una de las cosas que siempre he querido hacer es ser capaz de completar el
cubo de Rubik.
Mi jefe también es un viciao del dichoso juguetito, así que ya hace algún tiempo que quería comprarme uno. Por fin lo hice el pasado viernes en
La Maquinista de Barcelona, en una tienda que se llama
Afizonia y que tiene varias franquicias en toda España.
El caso es que ayer martes lo conseguí terminar por primera vez y ya puedo proclamarlo a los cuatro vientos. Claro que ahora que hasta
un robot de Lego es capaz de hacerlo, no sé si tiene tanto mérito. Y menos viendo algunos frikis que, como este
japonés, lo completan en cuestion de segundos...
Por supuesto, para lograr mi objetivo he necesitado consultar guías y técnicas, que he encontrado en internet. Os paso algunas que me han resultado útiles:
También me llama la atención lo relativamente habitual que es el tema del cubito en la blogosfera. Así, además de
Hermann, otros bloggers parecen haber sido cautivados por el "juguete" antes conocido como "Cubo mágico".
El ejemplo más representativo es Alvy, de
Microsiervos que tiene toda una
colección de artilugios tipo Rubik, además de innumerables
posts relacionados con el juguetito.
Pero no son los únicos. Otros como Fabrizio de
La Cosa Húmeda o
Enrique Barbeito no se han podido resistir a la influencia del cúbico aparatejo. También Walter, de
HtmlLife, nos ofrece una versión más humorística al respecto. Incluso Diego, de
Minid.net, ha hechos sus pinitos Rubikundos, pero eso sí, en flash.
Bueno ¿qué? ¿Alguien más se anima?
06/05/2004
Fire Blog Awards 2.0
Leyendo los últimos posts de
eCuaderno, descubro la existencia de estos premios bitacoreros, los
Fire Blog Awards 2.0, la segunda edición de un concurso sin pretensiones ideado por unos cacereños inquietos.
Se puede inscribir nuestro weblog en los
FBA, "los premios para blogs más absurdos de la red", hasta el día 15 de mayo, momento en el que empezarán las votaciones. Es una chorradilla, pero bueno, no está de más que te den un premio y, ya se sabe, los enlaces son visitas.
22/04/2004
Artículo sobre weblogs en la revista Digital World
La
Digital World del mes de abril presenta en su interior un reportaje sobre este cada vez más popular fenómeno.
Presenta un enfoque bastante acertado y califica a los weblogs como una herramienta para la libertad de expresión y una alternativa a los medios de comunicación tradicionales.
Incluye un glosario de los términos más comunes en este mundillo y, por lo demás, destacar las referencias directas a weblogs como
Perogrullo y
Barrapunto, entre otros.
También se citan, cómo no, los principales sistemas de publicación de bitácoras web:
Blogger,
Movable Type y
Pitas.
Sin duda, es cada vez más fuerte el impacto de los blogs en la sociedad y últimamente varios medios tradicionales se están haciendo eco de ello.
18/04/2004
Validación de RSS: fechas en formato RFC-822
La
especificación de documentos
RSS 2.0 incluye varias etiquetas para fechas, como pueden ser <pubDate> y <lastBuildDate>. Para que nuestro
RSS valide correctamente, será necesario que estas fechas estén en formato
RFC-822, esto es algo del tipo: "Sun, 18 Apr 2004 00:50:00 GMT".
Movable Type y otras herramientas generan este formato automáticamente, pero si utilizamos algún script de servidor para generar el archivo sindicado nos encontraremos ante un problemilla, pues ninguna función (al menos en
ASP) convierte directamente una fecha a este formato.
Además, para que la fecha sea aceptada y el documento valide, no solamente debe cumplir con el formato, sino que debe estar indicada en inglés. Es decir, para la fecha del ejemplo anterior no valdría: "Dom, 18 Abr 2004 00:50:00 GMT".
Esto supone que tengamos que crear unas funciones en nuestro script para conseguir la conversión/traducción. Para aquellos que utilicen
ASP y VBScript las siguientes líneas de código consiguen este resultado:
function AbbrDia(numDia)
select case numDia
case 1
AbbrDia = "Mon"
case 2
AbbrDia = "Tue"
case 3
AbbrDia = "Wed"
case 4
AbbrDia = "Thu"
case 5
AbbrDia = "Fri"
case 6
AbbrDia = "Sat"
case 7
AbbrDia = "Sun"
end select
end function
function AbbrMes(numMes)
select case numMes
case 1
AbbrMes = "Jan"
case 2
AbbrMes = "Feb"
case 3
AbbrMes = "Mar"
case 4
AbbrMes = "Apr"
case 5
AbbrMes = "May"
case 6
AbbrMes = "Jun"
case 7
AbbrMes = "Jul"
case 8
AbbrMes = "Aug"
case 9
AbbrMes = "Sep"
case 10
AbbrMes = "Oct"
case 11
AbbrMes = "Nov"
case 12
AbbrMes = "Dec"
end select
end function
function CeroDelante(str)
if len(str) = 1 then
CeroDelante = "0" & str
else
CeroDelante = str
end if
end function
function FormatoRFC822(fecha)
dim fechaRFC
fechaRFC = AbbrDia(DatePart("w", fecha)) & ", " _
& CeroDelante(DatePart("d", fecha))
fechaRFC = fechaRFC & _
" " & AbbrMes(DatePart("m", fecha)) & " " & _
DatePart("yyyy", fecha) & _
" " & CeroDelante(DatePart("h", fecha))
fechaRFC = fechaRFC & ":" & CeroDelante(DatePart("n", fecha)) & _
":" & CeroDelante(DatePart("s", fecha)) & " GMT"
FormatoRFC822 = fechaRFC
end function
Solamente hay que llamar a la función FormatoRFC22 pasándole como parámetro la fecha que queremos convertir a
RFC-822. Las funciones AbbrDia y AbbrMes devuelven la abreviatura en inglés del día de la semana y del mes respectivamente. CeroDelante (como su nombre indica) añade un 0 delante al día o al mes si es necesario.
16/04/2004
Generar ficheros RSS dinámicamente con ASP o PHP
Los que nos curramos "a mano" nuestro weblog nos encontramos con problemas bastante inusuales entre la blogosfera, debido a que la mayor parte de webloggers utilizan alguna herramienta para la creación de weblogs.
Concretamente al intentar
validar nuestro archivo
RSS generado dinámicamente con código
ASP o
PHP, podemos encontrarnos un par de errores que nos llevarán de cabeza, debido a la poca información que hay al respecto (y lo escueta que es la ayuda del
Feed Validator).
Uno de estos errores es el siguiente:
Message
Feeds should not be served with the ´text/html´ media type
Explanation
The web server is reporting an unexpected MIME type for a feed. Although we tried to parse it as a feed, aggregators may well report this as an error, and act as if the user had pointed them at something other than a feed.
Feeds should be served as application/rss+xml for RSS, application/atom+xml for Atom, or one of the more general XML types, preferably application/xml.
Solution
Use the appropriate MIME type for your feed
Al parecer, si no especificamos el tipo
MIME en nuestro archivo
RSS generado mediante un script de servidor, por defecto el navegador detectará que es "text/html" al ser archivos con extensión .asp o .php.
A pesar de que esto no invalida nuestro archivo sindicado, sí que es detectado como un error en el
Feed Validator y, por tanto, no validará. Como nos indica el mensaje de explicación, el tipo
MIME para un fichero RSS debe ser "application/rss+xml", aunque también valdría "application/xml".
¿Cómo especificar esta característica en nuestro código? Una sencilla línea de código al principio de nuestro script bastará, que diferirá en función del lenguaje que utilicemos:
Para
ASP: <% Response.ContentType = "application/xml" %>
Para
PHP: <? header("Content-Type: application/xml"); ?>
De esta sencilla manera, especificamos que se trata de un archivo en formato
XML, como es el caso de un
RSS.