Alguns cuidados com o Data Collection

Após um período de lab, testando a nova feature do sql server 2008 chamada Data Collection, acabei por configurar o recurso no ambiente de produção. Para minha surpresa apareceram detalhes que não consegui visualizar na fase de testes, e que requerem uma atenção dos DBAs:

1) Crescimento da MSDB: É sábido que a base de dados data warehouse, criada e configurada para armazenar a coleta do data collection, irá crescer de forma considerável (até assustadora), chegando facilmente a um tamanho médio de 5GB. Mas além de crescer a database do data collection, a db de sistema MSDB terá um incremento na sua taxa de crescimento. No meu ambiente, por exemplo, o MSDB que crescia quase nada, passou a crescer 9MB por dia. É bom policiar isso de perto.

2) Bug no step 2 do job collection_set_3_upload: É isso mesmo. Após configurar o data collection, os jobs são gerados automaticamente para realizar os trabalhos de coleta e upload para a base. Há um bug, inclusive comentado em sites de comunidade, que ocorre no job collection_set_3_upload. O job de forma aleatória acaba falhando, não sendo executado o step 2. Apesar disso, não se assuste. Haverá poucas falhas e isso não ocorre em todos os servidores (até isso é aleatório). Há um hot fix acumulativo para resolver esse problema para quem tem o sp1 do sql 2008 instalado, mas a própria microsoft recomenda que seja esperado o sp2. Então, minha recomendação é: tenha paciência com as falhas aleatórias (elas não impactam na coleta) e espere o SP2 do sql server 2008 (se ele vier neh, pois o R2 ta na área).

3) Report Disk Usage: esse relatório aponta, dentre outras coisas, a média de crescimento diário em MB das databases. Mas tome cuidado com essa informação: o crescimento é calculado com base nas operações de growth do banco, isto é, para cada vez que o arquivo de dados ou log sofre crescimento. Acho que isso não seja uma boa informação para os DBAs, pois temos que acompanhar diariamente o quanto de espaço dos arquivos do banco está alocado, de modo a prevermos quando ocorrerá o próximo growth. Normalmente faço isso com base no crescimento do uso de extents de cada arquivo (vou publicar uma matéria em breve ilustrando como fazer um base line de crescimento).

Bem, há outras coisas, mas essas são as que mais me chamaram a atenção. Apesar de tudo, estou usando o data collection, porque de fato ele é mais leve que o uso do perfmon, mais fácil e disponibiliza bons recursos de gerenciamento.



Deixe uma resposta

Preencha os seus dados abaixo ou clique em um ícone para log in:

Logotipo do WordPress.com

Você está comentando utilizando sua conta WordPress.com. Sair / Alterar )

Imagem do Twitter

Você está comentando utilizando sua conta Twitter. Sair / Alterar )

Foto do Facebook

Você está comentando utilizando sua conta Facebook. Sair / Alterar )

Foto do Google+

Você está comentando utilizando sua conta Google+. Sair / Alterar )

Conectando a %s