добавил бд для отсеивания
Some checks failed
continuous-integration/drone/push Build is failing

This commit is contained in:
2026-04-10 23:01:44 +10:00
parent 1f9df75924
commit ded74b2cc9
2 changed files with 80 additions and 24 deletions

View File

@@ -124,6 +124,44 @@ def get_all_promt():
return {"sources": sources}
def create_table_error_url():
with conn.cursor() as cur:
cur.execute("""
CREATE TABLE IF NOT EXISTS error_url (
id SERIAL PRIMARY KEY,
source_url TEXT NOT NULL,
error_sources_url TEXT NOT NULL
);
""")
print("Таблица error_url создана или уже существует")
def add_error_url(source_url: str, error_sources_url: str):
"""Добавляет запись об ошибке URL"""
with conn.cursor() as cur:
cur.execute("""
INSERT INTO error_url (source_url, error_sources_url)
VALUES (%s, %s)
RETURNING id;
""", (source_url, error_sources_url))
return cur.fetchone()[0]
def check_error_url(error_sources_url: str) -> bool:
"""Проверяет, есть ли запись в таблице error_url с таким URL"""
with conn.cursor(cursor_factory=RealDictCursor) as cur:
cur.execute("""
SELECT 1 FROM error_url
WHERE error_sources_url = %s
LIMIT 1;
""", (error_sources_url,))
row = cur.fetchone()
return row is None
# Пример использования
# if __name__ == "__main__":
# # create_table_config_gpt() # <-- раскомментировать эту строку
@@ -132,4 +170,5 @@ def get_all_promt():
# "name": "Корея",
# "promt": "Задача: Перевод на русский язык и тематическая фильтрация новостных статей из китайской прессы. \n Необходимо переводить текст статьи и определять, относится ли она к КНР по указанным темам: \n 1. Перевод\n Переведи предоставленный китайский текст на русский язык, сохранив оригинальный смысл, стиль и структуру.\n Текст:\n {content}\n -------------------------------------\n 2. Отбирай исключительно новости, прямо относящиеся к Китаю, его безопасности, соседним странам и территориям, влияющим на интересы Китая.\n Если не относится к Китаю — считаем, что статья НЕ подходит, и отдаем пустой JSON:\n {\"text\": \"\", \"pereskas\": \"\", \"title\": \"\", \"topics\": []}\n Если привязка есть — переходи к шагу 3. \n -------------------------------------\n 3. Тематическая классификация\n Определи, относится ли статья к одной или нескольким темам из списка:\n 1) Военные новости — конфликты, учения, мобилизация, закупки вооружений. \n 2) Пограничная деятельность — охрана границы, пограничные учения, строительство или модернизация пограничной инфраструктуры, техника для пограничников. \n 3) Пункты пропуска на границе с РФ — изменения режима работы, строительство, реконструкция, оборудование, логистика. \n 4) Пограничные реки — состояние рек, экология, инфраструктурные проекты, мониторинг. \n 5) Чрезвычайные ситуации — природные и техногенные происшествия, особенно затрагивающие пограничные реки и прилегающие земли. \n 6) Санитарно-эпидемиологическая обстановка — эпидемии, эпизоотии, эпифитотии, угрозы и меры предотвращения. \n 7) Индустриальные проекты (арктическое/антарктическое направление). \n 8) Индустриальные проекты в приграничных районах — заводы, производства, технопарки, новые технологии. \n 9) Инфраструктурные проекты в приграничных районах — дороги, мосты, транспорт, логистика. \n 10) Культура малочисленных народностей (нанайцы, монголы, уйгуры, нанайцы и хэчжэ) — политика, традиции, бытовая жизнь нанайцев, монголов, уйгуров, и хэчжэ (малочисленных народов).\n\n Отметь только те темы, которым статья действительно соответствует.\n\n -------------------------------------\n 4. Формат ответа \n Вернуть строго JSON без пояснений и дополнительных слов:\n {\n \"translation_text\": \"<перевод текста статьи на русский язык (дословный, точный и без сокращений ) >\",\n \"short_text\": \"<пересказ переведённого текста>\",\n \"title\": \"<краткая суть новости (12 предложения)>\",\n \"category\": \"<названий категорий, которым соответствует статья>\"\n }\n Если статья не относится ни к одной теме или не привязана к нужным регионам — вернуть:\n {\"translation_text\": \"\", \"short_text\": \"\", \"title\": \"\", \"category\": \"\"}"
# })
# print(get_promt("japan"))
# print(get_promt("japan"))
# create_table_error_url()