Публикации с меткой «работа»

Блокнот разработчика

Глюк при запуске django на uwsgi и mod_wsgi

Обнаружился странный и одновременно неприятный глюк – не подхватываются локали для языка отличного от указанного в LANGUAGE_CODE. Платформа – django 1.2.5, django-cms 2.1.0b3

Собственно – сама странность в том, что локали нормально отрабатывают при запуске проекта через runserver и runfcgi, никаких проблем нет и под gunicorn. Непонятное поведение зафиксировано только при работе под uwsgi или mod_wsgi.

Блокнот разработчика

Генерация изображения предпросмотра из загруженного видео

Часто возникает необходимость создания картинки предпросмотра для загруженного видеоролика на сайте. Это удобнее, чем вручную создавать скриншот, особенно при загрузке множества файлов, а уж про автоматизированные задачи говорить и не приходится. А выводить ради каждого ролика флешплеер неэкономично. Ниже я даю собственное видение этого функционала:



class Resource(Publisher, CommentableModel, SortableModel):
    title = models.CharField(max_length=255)
    slug  = models.SlugField()
    attachment  = models.FileField(upload_to=upload_file)
    type  = models.IntegerField(choices=TYPE_CHOICES, editable=False)
    description  = models.TextField(blank=True, default='')
    date_created = models.DateTimeField(default=datetime.now, editable=False)
    category     = models.ManyToManyField(Category, related_name='resources')

    snapshot = models.ImageField(
        blank     = True,
        null      = True,
        upload_to = upload_snapshot,
        help_text = _('Snapshot for resource, not required'),
    )

class Video(Resource):
    objects = VideoManager()

    def get_type(self):
        return FMT_VID

    class Meta:
        verbose_name = _('video')
        verbose_name_plural = _('videos')
        proxy = True

models.signals.pre_save.connect(new_video_thumbnail, sender=Video)
models.signals.post_save.connect(generate_video_thumbnail, sender=Video)

Как видно из кода, к модели Video присоединяется два сигнала — перед сохранением в базу данных и после.

Вот код самих сигналов:

def generate_thumbnail(source_file_path, tmp_file_path):

    args = ['-y', '-i', source_file_path, '-vframes', '1', '-ss', '00:00:02', '-an',
        '-vcodec', 'png', '-f', 'rawvideo', tmp_file_path]

    if os.path.exists(tmp_file_path):
        os.remove(tmp_file_path)

    p = subprocess.Popen(args, executable='ffmpeg')
    p.wait()

    return tmp_file_path

def get_tmp_path(source_path):
    return os.path.splitext(source_path)[0] + '.tmp'

def generate_video_thumbnail(sender, **kwargs):
    instance = kwargs.get('instance', None)
    created = kwargs.get('created', None)

    if created:
        instance.save()

    elif os.path.exists(instance.snapshot.path):
        tmp_file_path = get_tmp_path(instance.attachment.path)
        os.remove(tmp_file_path)

def new_video_thumbnail(sender, **kwargs):
    instance = kwargs.get('instance', None)

    if os.path.exists(instance.attachment.path):

        if instance.snapshot and os.path.exists(instance.snapshot.path):
            os.remove(instance.snapshot.path)

        tmp = generate_thumbnail(
                source_file_path = instance.attachment.path,
                tmp_file_path = get_tmp_path(instance.attachment.path)
            )
        source_filename = os.path.basename(instance.attachment.path)
        snapshot_name = os.path.splitext(source_filename)[0] + '.png'

        instance.snapshot = File(open(tmp), snapshot_name)

Всё волшебство происходит в методе generate_thumbnail, остальное разнообразие служит для корректной обработки создания нового экземпляра и редактирования существующего, когда изображение нужно сгенерировать заново, при замене видеоролика.

Блокнот разработчика

Django, разочарование, часть 1.

Последние три недели наша команда ударными темпами ведёт работу над сайтом 13-го Томского инновационного форума. Всё бы ничего, но по ходу дела возникли несколько проблем. Обо всём по-порядку:

Теггирование.

Существующее решение позволяет добавлять теги к любой сущности (что нам собственно и надо). Делает это за счет generic relations со стороны тегов (Tag + TaggedItem). И тут то возникает первая проблема – расчет тег-клауда. Проходит это в несколько этапов:

1. сам запрос выглядит довольно просто:

SELECT tags_tag.id, count(tags_tagged_item.id)
FROM tags_tag
JOIN tags_tagged_item ON tags_tagged_item.tag_id = tags_tag.id
GROUP BY tags_tag.id

Плюс, по идее HAVING на минимальное кол-во сущностей, помеченных этим тегом. В принципе, выбирая сразу название тега у нас на руках уже есть все данные для формирования клауда, осталось только вывести всё на шаблон, применив стили на основанию веса каждого тега в их общем множестве, объединив соседние величины, чтобы вписаться в ограниченный набор стилей – в итоге заимеем те самые размеры текста, которые так греют глаз. Но, нам надо формировать ссылку на список всех сущностей (сгруппированных по типу), которые были помечены тегом, нужен цельный экземпляр модели Tag. Итого – чтобы вернуть экземпляр тега + 1 запрос на каждый тег, для получения всех полей и маппинга данных в объект питона.

Самое интересное, что эта выборка-маппинг происходит еще на этапе расчета, т.к. в коде мы оперируем уж экземпляром тега:

max_weight = 10
cloud = []
for tag in Tag.objects.all():
    cloud.append([
        tag,
        math.log(tag.tagged_items.count()) * max_weight / math.log(max_weight)
    ])

Итог данного решения – жуткие тормоза в приложении, возникающие при передергивании БД на пересчет клауда.

Решение проблемы пришло с неожиданной стороны:

Для поиска по сайту мы используем solr, в индекс которого кладётся много чего, но все протеггированные сущности туда в итоге попадают тоже. Осталось ввести поле tags, объявив его списочным, наложить токенайзер, который разобъёт теги по запятым, и сделать фасеточную выборку из индекса, использовав теги в качестве ключевого поля:

        solr = Solr(settings.HAYSTACK_SOLR_URL)
        kwargs = {
            'facet': 'on',
            'facet.field': 'tags',
            'rows': 0,
            'start': 1
        }
        result = solr.search(q = 'language:%s' % language, **kwargs)

Возможно, конечно, что проблема тут в SQL бэкенде, в качестве которого был выбран PostgreSQL, и доступа к тюнингу которого у нас нет (сайт как и база крутится на хостинге заказчика, причем доступа к хосту с БД у нас нет). Но сам факт порождения такого числа запросов уже слегка расстраивает. Тегов много, очень много, одних статей в периодике уже >3K, отдельно лежат интервью (~1K) и библиотека мультимедиа (в сумме около 1K записей), и далеко не все теги встречаются с более-менее завидной частотой.
Но и это еще не всё, второй момент никак не затрагивает Django, скорее само решение по теггированию. При добавлении тегов к сущности как и все белые люди в обычное текстовое поле мы заносим список ключевых слов через запятую, при сохранении экземпляра разбираем их на этом основании и, лишив хвостовых пробелов, вызываем следующу магию – определяем, есть ли уже такой тег и если нет – создаём новый экземпляр, обновляем TaggedItem с внешними ключами на сам тег и модель. Это еще три запроса на каждый тег. Все происходит быстро, но только потому, что кол-во тегов к одной сущности вряд ли превышает десять штук. И каждый экземпляр модели обрабатывается контент-менеджером более-менее индивидуально.

Возможно, спасло бы кеширование, собственно, оно и спасало нас на начальных этапах, но выставляя большое время хранения клауда в кеше теряется актуальность, т.к. новые ресурсы поступают активно, и хотелось бы наблюдать динамику изменения клауда в приближении к реальному времени.

В общем – или отказываться от услуг ORM, или использовать стороннее решение, что произошло в нашем случае.

Если кто-то предложит красивый способ решения такой проблемы, буду очень благодарен.

PYонер

Ищу удаленную работу

Пишу на python, javascript
использую фреймворки django, jquery

по вопросам сотрудничества пишите devex.soft@gmail.com

Веб мозги

Хочу на работу

Хочу на fulltime удалённую работу python/django разработчиком со стандартной занятостью в пять рабочих дней в неделю. Последний год пробовал работать во freelance режиме на odesk.com — слишком гибко для меня.

Краткое резюме можно посмотреть по адресу lorien.name/cv.html Если вкратце, то занимаюсь django с 2007 года, питон в основном применял для веб-разработок и для различных скриптов сбора и обработки информации.

Мои контакты:

  • email/jabber: lorien@lorien.name
  • skype: lorien.name

Блокнот разработчика

Запуск сайта губернатора Томской области

Мы строили-строили и наконец построили! Не хочу, чтобы это было грязным пеаром, но таки сабж внедрен, краткое описание платформы и компонент: django (1.2 pre-alpha SVN-11741); django-cms (v. 4ba6062fb830fbc727ed907ad050c54ba1f8990a) (пришлось внести пару грязных хаков для инъекций своих данных в стандартный контекст страницы. Впрочем, в следующей итерации проекта будем стараться избавиться от этого непотребства. По-поводу использования и особенностей самой [...]

Блокнот разработчика

Запуск сайта губернатора Томской обл.

Мы строили-строили и наконец построили! Не хочу, чтобы это было грязным пеаром, но таки сабж внедрен, краткое описание платформы и компонент: django (1.2 pre-alpha SVN-11741); django-cms (v. 4ba6062fb830fbc727ed907ad050c54ba1f8990a) (пришлось внести пару грязных хаков для инъекций своих данных в стандартный контекст страницы. Впрочем, в следующей итерации проекта будем стараться избавиться от этого непотребства. По-поводу использования и особенностей самой [...]

Метки

.net .NET C# .sort 1.2 2009 2010 404 error admin ajax amazon analytics and apache api archlinux asp.net async asynchronous autocomplete bash blender blog blogengine blogs book bootstrap bot bpython buildout byteflow bzr C c plus plus C++ cache cbv Chaco checkio chrome ci ckeditor class based views clojure closure cms cms с удобной админкой code coding style collectd COM comet competition conference ConfigParser contest Context continuous integration CouchDB coverage CppCMS cpyext cpython crud csrf CSS ctypes curl custom model fields cx_freeze cython database db dbm dbqueries debian debug debugging decorator decorators deploy deployment descriptor design dev devconf developers development diveintopython Django django 1.2 django 1.3 django advent django framework django template django trunk django weblog django-admin-tools django-cms django-compressor django-hosts django-piston django-registration django-sphinx django.admin djangoadvent djangocms djangodash doc documentation drupal e-legion eclipse EGit emacs encoding Enthought epoll erlang event exception ExtJS fabric facebook fastcgi finaloption fixtures fonts forms formset fp framework freebsd freeswitch fs2web ftp fun funcparserlib functional gae gamin gandi generic views gettext gevent gil git github gitosis Google Google App Engine google picasa Google Translate google wave Google Web Toolkit grab grablab greenlet gtd gui haskell hg hgshelve highlighter host hosting how-to howto html html5lib Hudson humor i18n icfpc ide idiomatic image-scripting improvements Internet interpreter ipython ironpython izmenimsya.ru jabber java javascript jenkins jetbrains JIT job jquery json jstree jython kde kiev kiyv kyivpy l10n ldap library libs Life Links linux Linux & Unix LLVM logging logs lxml Mac OS X magic mail markdown Matplotlib Mayavi maybe mediavirus meetup memcache Memcached memory messages metaclass middleware migration mikrotik mkd model models mod_python mod_wsgi mongodb monitoring mptt musicmans.ru musicx mvc my-projects mysql netCDF networkx newforms newforms-admin news nginx Nhibernate nix nose NoSQL numpy oop open source OpenID openoffice opster optimization oracle orm os pagination parsing path patterns pdf PDF-принтер PEP PEP8 performance performance optimization perl personality photo php picture-driven computing PIL pinax pingback pip plasma plone plugin plugins postgresql programming progress bar psycopg2 py2exe pybb pybbm pycamp pycharm pycon pycow pycurl pydev pygtk pylons PyNGL pypy pyqt PyQt4 pyrad pyramid PySide Python Python 2.5 python 2.7 python 3 python c api python speed python-mssql python3 pywinauto Qt Qt4 queue rabbitmq radius raw sql re redis redsolution redsolution cms regexp regular expressions release repoze.bfg RequestContext reusable apps robokassa rss ru ruby ruby-on-rails sample satchmo scalability SciPy scraping screencast search selenium self.error seo server setattr settings setuptools shell sikuli sms snippet socket.io software sorting south sphinx spider sql sqlalchemy sqlite ssh startup step-by-step subdomain subversion svn SyntaxHighlighter system tags tdd tddspry teh drama template templates templatetags test testing thinkpad threading threads tips tips and tricks tools tornadio tornado tornado server tricks tutorial tweepy twisted twitter typography uapycon Ubuntu ucsvlog uml Uncategorized unicode unit test unit testing UnitTest Unladen Swallow upload urllib urls utf-8 uwsgi validation vcs versioning video vim virtualenv Visual Studio vkontakte voip wave web web-devel web-services web-разработка webdev webfaction webkit webpy websockets webtest widget widgets Win API windows Wirbel work wrapper wsgi wxPython wxWidgets wysiwyg xapian xml xmonad xmpp xpath yandex youtube zip zomg zope [cdata[cbv]] [cdata[ci]] [cdata[class based views]] [cdata[continuous integration]] [cdata[django framework]] [cdata[django-sphinx]] [cdata[django]] [cdata[nginx]] [cdata[python]] [cdata[virtualenv]] [cdata[программирование]] автоматизация администрирование администрирование django админка алгоритмы архитектура атрибуты базы данных Без рубрики безопасность библиотеки блоге бот веб-разработка видео Визуализация данных вконтакте Все записи гвидо ван россум граббер графика графы декоратор декораторы дескриптор дескрипторы документация заметки игра жизнь идея интересное киев Клиентам книги конференция личное математика метаклассы модели модули монады морфология мысли невозможное новости о облачные вычисления обо мне Обработка данных оптимизация оптимизация кода Основная лента основы парсинг парсинг сайтов перевод песочница Питон поебень поиск правила кодирования программирование Проектирование производительность работа рабочее размышлизмы Разное разработка разработка приложений разработки регулярные выражения сайт событие события ссылки статьи тестирование тесты Тюмень убунтариум фигня философия формы форум Хабрахабр хакинг хостинг шаблоны шаблоны проектирования эксперимент Эксперименты юмор я пиарюсь Яндекс