Como usar o Amazon MWAA com Amazon RDS para Microsoft SQL Server - Amazon Managed Workflows for Apache Airflow

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

Como usar o Amazon MWAA com Amazon RDS para Microsoft SQL Server

É possível usar o Amazon MWAA para se conectar a um RDS para SQL Server. O código de exemplo a seguir é usado DAGs em um ambiente Amazon Managed Workflows for Apache Airflow para se conectar e executar consultas em um Amazon RDS para Microsoft SQL Server.

Versão

  • O código de amostra nesta página pode ser usado com o Apache Airflow v1 em Python 3.7.

  • É possível usar o exemplo de código nesta página com o Apache Airflow v2 no Python 3.10.

Pré-requisitos

Para usar o código de amostra nesta página, você precisará do seguinte:

  • Um ambiente Amazon MWAA.

  • O Amazon MWAA e o RDS para SQL Server estão sendo executados na mesma Amazon VPC/

  • Os grupos de segurança de VPC do Amazon MWAA e do servidor estão configurados com as seguintes conexões:

    • Uma regra de entrada para a porta 1433 aberta para o Amazon RDS no grupo de segurança do Amazon MWAA

    • Ou uma regra de saída para a porta 1433 aberta do Amazon MWAA para o RDS

  • A conexão do Apache Airflow de RDS para SQL Server reflete o nome do host, a porta, o nome de usuário e a senha do banco de dados do servidor SQL do Amazon RDS criado no processo anterior.

Dependências

Para usar o código de amostra nesta seção, adicione a seguinte dependência ao seu requirements.txt. Para saber mais, consulte Como instalar dependências do Python

Apache Airflow v2
apache-airflow-providers-microsoft-mssql==1.0.1 apache-airflow-providers-odbc==1.0.1 pymssql==2.2.1
Apache Airflow v1
apache-airflow[mssql]==1.10.12

Conexão Apache Airflow v2

Caso esteja usando uma conexão no Apache Airflow v2, certifique-se de que o objeto de conexão Airflow inclua os seguintes pares de chave-valor:

  1. ID de conexão: mssql_default

  2. Tipo de conexão: Amazon Web Services

  3. Host: YOUR_DB_HOST

  4. Esquema:

  5. Login: admin

  6. Senha:

  7. Porta: 1433

  8. Extra:

Exemplo de código

  1. No prompt de comando, navegue até o diretório em que o código do DAG está armazenado. Por exemplo:

    cd dags
  2. Copie o conteúdo da amostra de código a seguir e salve localmente como sql-server.py.

    """ Copyright Amazon.com, Inc. or its affiliates. All Rights Reserved. Permission is hereby granted, free of charge, to any person obtaining a copy of this software and associated documentation files (the "Software"), to deal in the Software without restriction, including without limitation the rights to use, copy, modify, merge, publish, distribute, sublicense, and/or sell copies of the Software, and to permit persons to whom the Software is furnished to do so. THE SOFTWARE IS PROVIDED "AS IS", WITHOUT WARRANTY OF ANY KIND, EXPRESS OR IMPLIED, INCLUDING BUT NOT LIMITED TO THE WARRANTIES OF MERCHANTABILITY, FITNESS FOR A PARTICULAR PURPOSE AND NONINFRINGEMENT. IN NO EVENT SHALL THE AUTHORS OR COPYRIGHT HOLDERS BE LIABLE FOR ANY CLAIM, DAMAGES OR OTHER LIABILITY, WHETHER IN AN ACTION OF CONTRACT, TORT OR OTHERWISE, ARISING FROM, OUT OF OR IN CONNECTION WITH THE SOFTWARE OR THE USE OR OTHER DEALINGS IN THE SOFTWARE. """ import pymssql import logging import sys from airflow import DAG from datetime import datetime from airflow.operators.mssql_operator import MsSqlOperator from airflow.operators.python_operator import PythonOperator default_args = { 'owner': 'aws', 'depends_on_past': False, 'start_date': datetime(2019, 2, 20), 'provide_context': True } dag = DAG( 'mssql_conn_example', default_args=default_args, schedule_interval=None) drop_db = MsSqlOperator( task_id="drop_db", sql="DROP DATABASE IF EXISTS testdb;", mssql_conn_id="mssql_default", autocommit=True, dag=dag ) create_db = MsSqlOperator( task_id="create_db", sql="create database testdb;", mssql_conn_id="mssql_default", autocommit=True, dag=dag ) create_table = MsSqlOperator( task_id="create_table", sql="CREATE TABLE testdb.dbo.pet (name VARCHAR(20), owner VARCHAR(20));", mssql_conn_id="mssql_default", autocommit=True, dag=dag ) insert_into_table = MsSqlOperator( task_id="insert_into_table", sql="INSERT INTO testdb.dbo.pet VALUES ('Olaf', 'Disney');", mssql_conn_id="mssql_default", autocommit=True, dag=dag ) def select_pet(**kwargs): try: conn = pymssql.connect( server='sampledb.<xxxxxx>.<region>.rds.amazonaws.com', user='admin', password='<yoursupersecretpassword>', database='testdb' ) # Create a cursor from the connection cursor = conn.cursor() cursor.execute("SELECT * from testdb.dbo.pet") row = cursor.fetchone() if row: print(row) except: logging.error("Error when creating pymssql database connection: %s", sys.exc_info()[0]) select_query = PythonOperator( task_id='select_query', python_callable=select_pet, dag=dag, ) drop_db >> create_db >> create_table >> insert_into_table >> select_query

Próximas etapas