Публикации с меткой «tips»

Oduvan’s Web Blog

Python. Json. Как не сериализировать уже сериализированое

Бомбезное название придумал!

Проблема. У меня в таблице в 2х полях лежить жсон. А в ответ на запрос пользователю я должен вернуть другой дсон, некоторыми ключами которого будут жсоны из наших полей.

Решение в лоп – загрузится с этих полей данные и использовать их в формировании жсона. Но получается дурная работа

  1. return json.dumps({
  2.     'user_id':request.user.id
  3.     'user_data':request.user.data(),
  4.     'info_1':json.loads(model_obj.info1),
  5.     'info_2':json.loads(model_obj.info2)
  6. })

тут получается мы гоняем данные из жсона и обратно в холостую. Я тут наклепал небольшой модулик с использованием json чтоб этого не делать

  1. import json
  2. loads = json.loads
  3.  
  4. class JSONotEncode(object):
  5.     def __init__(self,data):
  6.         self.str = data
  7.  
  8. def simple(data):
  9.     return JSONotEncode(data)
  10.  
  11. class JSONEncoderSimple(json.JSONEncoder):
  12.     def _iterencode(self,obj,*args,**kwargs):
  13.         if isinstance(obj, JSONotEncode):
  14.             return obj.str
  15.         return json.JSONEncoder._iterencode(self,obj,*args,**kwargs)
  16.  
  17. def dumps(data):
  18.     return json.dumps(data,cls=JSONEncoderSimple)
  19.  
  20. def loads(data):
  21.     return json.loads(data)
  22.  
  23. if __name__ == '__main__':
  24.     print dumps({'a':1,'b':'sdr','c':simple('{"v":1}')})

Как видите, теперь данные, которые и так JSON просто оборачиваем в функцию simple и холостого хода не происходит.

Oduvan’s Web Blog

Django. Быстрый способ сохранить копию объекта

  1. from money.models import Trans
  2. cur_model = Trans.objects.all()[0]
  3. // and make a copy
  4. cur_model.pk = None
  5. cur_model.save() //ha ha

Oduvan’s Web Blog

Допоплнительные точки расширения Вашего апа

при создании нового джанго проекта я всегда выделяю две папки apps – для моих апов и compat – для сторонних апов, к разработки которых я не имею никакого отношения. Идея в том, что эти апы всегда остаются неприкосновенными для меня, и единственной точкой расширения остаются сеттингсы и возможно доп параметры, при инклюде урлов.

А представьте, что вы создаете апу с именем catalog, ее вы потом хотите выложить в общее пользования, и необходимо для нее сделать больше точек расширения. Структура такого апа может быть

  • catalog
    • urls.py
    • views.py
    • models.py
    • settings.py
    • tests.py

для 4 первых файлов можно просто вконце файла добавить строку, которая станет универсальной точкой расширения. Например для views.py

  1. try:
  2.     from ex_catalog.views import *
  3. except ImportError:
  4.     pass

таким образом, если кто-то будет использовать Вашу апу — точкой расширения будет дополнительная апа ex_catalog, в котором вы можете переопределить некоторый функции из view.py, и при этом ex_catalog не надо добавлять в список апов в настройках.

А теперь главный вопрос этого поста. Почему так не делают?

Oduvan’s Web Blog

Кешируйте с умом.

Всем привет. Да, знаю, я давно не писал. Ну простите, и как это не банально, был занят. А заставила меня написать одна мысля. И пожалуйста, дочитайте это до конца, потому что или это очень круто или я опять что то не понимаю, и с температурой 38 мне лучше за клаву не садиться.

Кеш. Я им пользуюсь для того, чтобы данные, которые я долго вычисляю — положить в память куда нить, чтоб если они понадобились — быстро их оттуда взять. Ну а если их там нет, то просто пересчитать и положить. Если вы им пользуетесь также, то читайте дальше иначе напишите комментарий, который начнется со слов: «Тю, блин, а я его совершенно по другому юзаю, глянь…»

Т.е. на сетах и гетах все сводится к примерно следующему алгоритму.

  1. from django.core.cache import cache
  2.  
  3. def setter(key,l_value,timeout=0):
  4.     val = cache.get(key)
  5.     if val is None:
  6.         val = l_value()
  7.         cache.set(key,val,timeout)
  8.     return val

где l_value — это ссылка на функцию, значение которой будет получено, в случае если его нет в кеше.

Вот этот умопомрачительный алгоритм у меня лежит в основе кеширования.

Хух… если у вас также, то идете дальше. Надеюсь сейчас осталось достаточно народу.

Прогуливаясь легкой и непринужденной походкой по блогосфере рунете я уже в который раз натыкаюсь на довольно странное решение следующей проблемы.

Если есть какие либо данные которые системе нужны часто, но вычисляются долго, то их прямое получение по алгоритму, описанному выше — просто убивает систему. Потому что как только они пропадают из кеша — все, кому нужны эти данные — начинают скопом — все вместе их получать. Например статистика по пользователям у вас вычисляется 5 сек, а выводится на главной странице, с посещаемостью 50 чел в сек, значит одновременно эти данные будут получать 250 процессов – что, может привести к смерти.

Решение рунета — 2 кеша. В один кладем с одним эксперейшеном, в другой с таким же, но чуть больше. Я думаю многие натыкались на такие решения, но вкратце — если заэкспаирилось в первом — берем из второго, но первый, кто узнал, о том, что заэкспаирилось — пересчитывает.

Тут просто тьма тьмущая узких мест

1.Старт у системы должен быть особый. Т.е. в нулевой точке в кеше уже должны быть часто доступные данные.
2.У вас двойные данные в кеше, т.е. две копии, а ведь часто бывает и такое, что трудновычисляемые данные — это и большие данные.
3.И последнее — если процесс, который вычисляет заекспаревшиеся данные — умирает. То умирают все. Явно теряем в отказоустойчивости.

Кратко опишу свой алгоритм решения, и построенный на нем джанговый кешовый бекенд (за базовый взят мемкешовый).

Если в ячейку с ключем класть не данные, а хеш из двух значений — данные, и время, когда их надо обновить. (ТАДАМ избавились от второго пункта)

А что если ты перед началом вычислений будеш класть в другой системый и уникальный ключ в кеше время, когда первый, начавший вычисления – планирует их закончить. А остольные процессы, которые захотят получить данные и не увидят их — смогут орентироваться на системный ключь, чтоб понимать, что данные скоро будут и их необходимо подождать или мы не дождались и попробуем еще раз. (ТАДАМ избавились от первого и третьего)

А теперь скучный код. Чтоб легче было читать — его необходимо скрестить с алгоритмом, который я описывал выше. И если функция гет — вернет None то эти данные сразу начнут вычисляться.

Небольшой рандом необходим, чтоб все процессы сразу не набросились вычислять после первого сдавшегося, а нарастающий таймаут необходим для быстрого избавления от быстрых данные и размеренного ожидания долгих.

  1. from django.core.cache.backends.memcached import CacheClass as BaseCacheClass
  2. from datetime import datetime,timedelta
  3. from time import sleep
  4. from random import random
  5. from time import sleep
  6.  
  7. ADDITION_EXP_TIME = 20
  8. TIME_FOR_CREATE = 5
  9.  
  10. class CacheClass(BaseCacheClass):
  11.     def add(self, key, value, timeout=0):
  12.         timeout = timeout or self.default_timeout
  13.         value = {'v':value,'e':datetime.now()+timedelta(seconds=timeout)}
  14.         super(CacheClass,self).add(key,value,timeout+ADDITION_EXP_TIME)
  15.        
  16.     def set(self, key, value, timeout=0):
  17.         timeout = timeout or self.default_timeout
  18.         value = {'v':value,'e':datetime.now()+timedelta(seconds=timeout)}
  19.         super(CacheClass,self).set(key,value,timeout+ADDITION_EXP_TIME)
  20.    
  21.     def get(self,key, default=None):
  22.         wait_next_val = 0
  23.         while True:
  24.             wait_next_val += 0.1
  25.             value = super(CacheClass,self).get(key,default)
  26.             now = datetime.now()
  27.            
  28.             if value is not None and now<value['e']:
  29.                 return value['v']
  30.            
  31.             wait_system_key = 'wait_system__%s__wait_system'%key
  32.             wait_system = super(CacheClass,self).get(wait_system_key)
  33.            
  34.             # if you find expired key first or you don't wait the next person
  35.             if wait_system is None or wait_system<now:
  36.                 super(CacheClass,self).set(wait_system_key,datetime.now()+timedelta(seconds=TIME_FOR_CREATE),TIME_FOR_CREATE + 5)
  37.                 return None
  38.            
  39.             #if somebody already getting a new value
  40.             if value is not None:
  41.                 return value['v']
  42.            
  43.             sleep(random()*wait_next_val)

И на всякий случай. Если вы все таки считаете это отличной идее. Кладем это в файлик с незамысловатым названием smart_cache.py рядом с settings.py, а в settings.py записываем

  1. CACHE_BACKEND = "smart_cache://127.0.0.1:11211"

Oduvan’s Web Blog

WinPdb дебажить джангу стало еще легче

Хоть простой и нативный pdb и так нам давал все что надо, все же приятно понимать, что есть еще чтото, что может сделать наш девелов приятней. WinPDB – одна из этих приятностей (наткнулся на нее вДжанговкой Вики) . Если коротко – это дебагер с приятным пользовательским интерфейсом, которой кросc-платформенный к слову говоря.

Пользовать легко.
Раньше вы коде оставляли:

  1. import pdb; pdb.set_trace()

А теперь получается чуть длиннее:

  1. import rpdb2; rpdb2.start_embedded_debugger('mysuperpassword')

На сколько я понял, этот пароль нужен для авторизации дебагера в эту точку прерывания. Т.е. как и pdb, rpdb2 отсанавливает выполение в этой строке.

Запускаем winpdb. File => Attach. В появившемся окне вводим наш пароль mysuperpassword. В полученном списке выбираем наш.

Но самое клевое, что теперь мы можем дебагером зацепиться там, где раньше не умели, например wsgi скрипт висит в апаче. Мы можем по средствам этого механизма присосаться и к нему.

P.S. …

И
-sheet/">
-sheet/">
-sheet/">Django Cheet Sheet
, кто еще не знает…
И надо будет испытать django-tinymce

Oduvan’s Web Blog

Urls и views в одном файле.

Я уже посягал на суверинитет джанги. Но это было давно и не правда. Более того, меня тогда убедили, что делаю я глупости, и я даже убедился сам, в последствии, что на самом деле делаю глупости. Но мысть о том, что urls.py не нужен – не перестает меня беспакоить. Поэтому очередно фин, аморальный бред – называйте как хотите, но мне безумно нравится.

Идея проста. Вьюха и урла всегда вместе – а значит одно должно быть декоратаром для другого.

Итак главный urls.py имеет обычный вид

  1. from django.conf.urls.defaults import *
  2.  
  3. urlpatterns = patterns('',
  4.     (r'^someurl/',include('someapp.url_view')),
  5. )

/someapp/url_view.py – тут у нас сбстно и хранятся вьюхи с урлами. Как видите, декоратор tourl нам земенил запись в urls.py

  1. from django.http import HttpResponse
  2. from tourl import tourl
  3.  
  4. @tourl(r'^and/$')
  5. def and_(request):
  6.     return HttpResponse('and')
  7.  
  8. @tourl(r'^gg/$')
  9. def index(request):
  10.     return HttpResponse('OK')

/someapp/tourl.py – ну и код самого декоратора

  1. from django.conf.urls.defaults import *
  2. import sys
  3. import functools
  4. def tourl(url_patern,*args,**kwargs):
  5.     def paramed_decorator(func):
  6.         @functools.wraps(func)
  7.         def decorated(self):
  8.             return func(self)
  9.         module =sys.modules[func.__module__]
  10.        
  11.         if not hasattr(module, 'urlpatterns'):
  12.             module.urlpatterns = patterns('',)
  13.              
  14.         module.urlpatterns   += patterns('',
  15.             url(url_patern,decorated,*args,**kwargs),
  16.         )
  17.         return decorated
  18.     return paramed_decorator

Помоему и симпотично и по производительности не бьет. Вобщем конфетка! Что скажите?

PS: Добавил снипет.

PSS: В снипетсах посоветовали добавить functools.wraps

PSS: А еще можно использовать и так

  1. from django.http import HttpResponse
  2. from tourl import tourl, patterns,url
  3.  
  4.  
  5.  
  6. @tourl(r'^and/$')
  7. def and_(request):
  8.     return HttpResponse('and')
  9.  
  10.  
  11. def index(request):
  12.     return HttpResponse('OK')
  13.  
  14. tourl(r'^gg/$')(index)
  15.  
  16.  
  17. def ordinary(request):
  18.     return HttpResponse('Ordinary')
  19.  
  20. urlpatterns += patterns('',
  21.             url(r'^ord/$',ordinary)
  22.         )

Lazy Crazy Coder's blog

How to make email field optional in django.contrib.comments

Today I solved a little problem on my personal blog http://svetlyak.ru. I'm using the django.contrib.comments there, and some my readers encounter a problem. They are registered using OpenID, but don't have a email in their accounts, because OpenID provider does not share that information.

So, when such users tried to post a comment on my blog, they are shown a page with error, because email is required field.

I found a simple way to make an email field optional. All what you need is to add additional app in the INSTALLED_APPS, and COMMENTS_APP variable. In my case it's looks like that:

INSTALLED_APPS = (
    'django.contrib.sessions',
    'django.contrib.auth',
    'django.contrib.contenttypes',
    'django.contrib.sites',
    'django.contrib.admin',
    'django.contrib.markup',
    'django.contrib.sitemaps',
    'django.contrib.humanize',
    'django.contrib.comments',
    'django_faces',
    'django_openid',
    'blog',
    'gallery',
    'tagging',
    'firefly.utils',
    'firefly.my_comments',
)
COMMENTS_APP = 'firefly.my_comments'

Next, in file my_comments.py:

from django import forms
from django.utils.translation import ugettext_lazy as _
from django.contrib.comments.forms import CommentDetailsForm

class CommentForm(CommentDetailsForm):
    email = forms.EmailField(label=_("Email address"), required=False)

def get_form():
    return CommentForm

That's it! By the way, you can change other behaviour too. Just look at the sources of django/contrib/comments/__init__.py file.

Lazy Crazy Coder's blog

How to make email field optional in django.contrib.comments

Today I solved a little problem on my personal blog

Еще один блог о Django

Перевод строки в Boolean-тип в Python

Все гениальное просто, а премудростями, описанными в сабже, в Python занимается distutils.util.strtobool. Примеры использования данной функции настолько тривиальны, что я ограничусь уже вышесказанным ;)

зы. Давно уже присматривался к Posterous и вот наконец-то созрел для того, чтобы попробовать. Отныне на этом блоге будут хранится подобные советы, связанные в основном с Питоном и Джанго.

Lazy Crazy Coder's blog

Equality and identity fun with python

>>> assert( int(0) is not long(0) )
>>> assert( int(0) == long(0) )

So, never write like this:

if var is 0:
    print 'Cool!'

Because if type(var) == 'long' it does not work.

Lazy Crazy Coder's blog

Equality and identity fun with python

>>> assert( int(0) is not long(0) )
>>> assert( int(0) == long(0) )

So, never write like this:

if var is 0:
    print 'Cool!'

Because if type(var) == 'long' it does not work.

Еще один блог о Django

Полезные функции в Django

В Django существует куча полезных функций и классов, которые помогают выполнять простые и полезные действия раз от разу. Предлогаю Вам свое видение этого списка:

django.utils.datastructures.SortedDict
django.utils.datastructures.MultiValueDict
По умолчанию в Python объект dict не поддерживает сортировку ключей и несколько значений для одного ключа. Именно поддержку этих возможностей дают перечисленные выше классы. Например, поддержка GET, POST, REQUEST массивов в объекте request реализована в виде MultiValueDict объектов.
django.utils.dates
Этот модуль содержит разнообразные массивы, которые используются для печати SelectDateWidget'а.
django.utils.encoding.force_unicode
Переводит любой Python объект в unicode. Так же переводит в unicode любую модель Django у которой есть метод __unicode__.
django.utils.html.clean_html
Очищает переданный в функцию HTML строку, а именно:
  • Конвертирует <b> и <i> в <strong> и <em>.
  • Правильно кодирует все амперсанды.
  • Удаляет все "target" аттрибуты с тегов <a>.
  • Конвертирует явно заданные баллетсы (bullets) в неупорядоченные HTML списки.
  • Удаляет из текста фрагменты "<p>&nbsp;&nbsp;</p>", но только если они находятся в конце текста.
django.utils.html.urlize
Переводит все ссылки в тексте в <a> тэги.
django.utils.safestring.mark_safe
Обозначает любой строковой объект, как безопасный для того, чтобы он мог был беспрепятственно распечатан в шаблоне без эскейпинга символов.
django.utils.text.get_text_list
Для описания работы этой функции и doctest'а хватит:
>>> get_text_list(['a', 'b', 'c', 'd'])
u'a, b, c or d'
>>> get_text_list(['a', 'b', 'c'], 'and')
u'a, b and c'
>>> get_text_list(['a', 'b'], 'and')
u'a and b'
>>> get_text_list(['a'])
u'a'
>>> get_text_list([])
u''

Надеюсь, что Вам пригодится что-то из моего списка.

Lazy Crazy Coder's blog

How to create a global lock using MySQL

When you writing a distributed application or webservice, sometimes you need to synchronize processes on different machines. For example, you may need to run some cron job once on a random machine.

If you are using MySQL, than you can ise it's GET_LOCK function, to accomplish this task. I wrote this helper to create global lock in python, using with statement:

import contextlib
@contextlib.contextmanager
@write_session
def global_lock(name, timeout, session):
    result = session.execute('SELECT GET_LOCK(%s, %s)', (name, timeout)).fetchall()
    result = len(result) == 1 and result[0][0]
    try:
        yield result and True or False
    finally:
        if result:
            session.execute('DO RELEASE_LOCK(%s)', (name, ))

Here write_session is decorator, which passes a session argument to a function. Here I use sqlalchemy's session, but you could use MySQLdb's connection or something like that.

And here is one of usecases for function:

def cron():
    with global_lock('myapp.cron_lock', 0) as acquired:
        if acquired:
            do_something_significant()
        else:
            exit_without_doing_any_job()

That's it. But make sure, to use unique name for the lock, because you may get in trouble if some other application uses same name.

Lazy Crazy Coder's blog

How to create a global lock using MySQL

When you writing a distributed application or webservice, sometimes you need to synchronize processes on different machines. For example, you may need to run some cron job once on a random machine.

If you are using MySQL, than you can ise it's GET_LOCK function, to accomplish this task. I wrote this helper to create global lock in python, using with statement:

import contextlib
@contextlib.contextmanager
@write_session
def global_lock(name, timeout, session):
    result = session.execute('SELECT GET_LOCK(%s, %s)', (name, timeout)).fetchall()
    result = len(result) == 1 and result[0][0]
    try:
        yield result and True or False
    finally:
        if result:
            session.execute('DO RELEASE_LOCK(%s)', (name, ))

Here write_session is decorator, which passes a session argument to a function. Here I use sqlalchemy's session, but you could use MySQLdb's connection or something like that.

And here is one of usecases for function:

def cron():
    with global_lock('myapp.cron_lock', 0) as acquired:
        if acquired:
            do_something_significant()
        else:
            exit_without_doing_any_job()

That's it. But make sure, to use unique name for the lock, because you may get in trouble if some other application uses same name.

Lazy Crazy Coder's blog

Don't be lazy when writing 'if' statements in the Python

If you want to check some object is None, don't be lazy, write full statement like this:

res = someFunction()
if res is None:
    print 'blah-minor'

If you write:

if res:
    do_something_useful()

then you can get strange behavior, because not all objects evaluate to True.

For example, try this code:

import xml.etree.ElementTree as ET e = ET.Element('blah') if e: print 'Hello from elementtree'

You'll be surprised.

Метки

.net .NET C# .sort 1.2 2009 2010 404 error admin ajax amazon analytics and apache api archlinux asp.net async asynchronous autocomplete bash blender blog blogengine blogs book bootstrap bot bpython buildout byteflow bzr C c plus plus C++ cache cbv Chaco checkio chrome ci ckeditor class based views clojure closure cms cms с удобной админкой code coding style collectd COM comet competition conference ConfigParser contest Context continuous integration CouchDB coverage CppCMS cpyext cpython crud csrf CSS ctypes curl custom model fields cx_freeze cython database db dbm dbqueries debian debug debugging decorator decorators deploy deployment descriptor design dev devconf developers development diveintopython Django django 1.2 django 1.3 django advent django framework django template django trunk django weblog django-admin-tools django-cms django-compressor django-hosts django-piston django-registration django-sphinx django.admin djangoadvent djangocms djangodash doc documentation drupal e-legion eclipse EGit emacs encoding Enthought epoll erlang event exception ExtJS fabric facebook fastcgi finaloption fixtures fonts forms formset fp framework freebsd freeswitch fs2web ftp fun funcparserlib functional gae gamin gandi generic views gettext gevent gil git github gitosis Google Google App Engine google picasa Google Translate google wave Google Web Toolkit grab grablab greenlet gtd gui haskell hg hgshelve highlighter host hosting how-to howto html html5lib Hudson humor i18n icfpc ide idiomatic image-scripting improvements Internet interpreter ipython ironpython izmenimsya.ru jabber java javascript jenkins jetbrains JIT job jquery json jstree jython kde kiev kiyv kyivpy l10n ldap library libs Life Links linux Linux & Unix LLVM logging logs lxml Mac OS X magic mail markdown Matplotlib Mayavi maybe mediavirus meetup memcache Memcached memory messages metaclass middleware migration mikrotik mkd model models mod_python mod_wsgi mongodb monitoring mptt musicmans.ru musicx mvc my-projects mysql netCDF networkx newforms newforms-admin news nginx Nhibernate nix nose NoSQL numpy oop open source OpenID openoffice opster optimization oracle orm os pagination parsing path patterns pdf PDF-принтер PEP PEP8 performance performance optimization perl personality photo php picture-driven computing PIL pinax pingback pip plasma plone plugin plugins postgresql programming progress bar psycopg2 py2exe pybb pybbm pycamp pycharm pycon pycow pycurl pydev pygtk pylons PyNGL pypy pyqt PyQt4 pyrad pyramid PySide Python Python 2.5 python 2.7 python 3 python c api python speed python-mssql python3 pywinauto Qt Qt4 queue rabbitmq radius raw sql re redis redsolution redsolution cms regexp regular expressions release repoze.bfg RequestContext reusable apps robokassa rss ru ruby ruby-on-rails sample satchmo scalability SciPy scraping screencast search selenium self.error seo server setattr settings setuptools shell sikuli sms snippet socket.io software sorting south sphinx spider sql sqlalchemy sqlite ssh startup step-by-step subdomain subversion svn SyntaxHighlighter system tags tdd tddspry teh drama template templates templatetags test testing thinkpad threading threads tips tips and tricks tools tornadio tornado tornado server tricks tutorial tweepy twisted twitter typography uapycon Ubuntu ucsvlog uml Uncategorized unicode unit test unit testing UnitTest Unladen Swallow upload urllib urls utf-8 uwsgi validation vcs versioning video vim virtualenv Visual Studio vkontakte voip wave web web-devel web-services web-разработка webdev webfaction webkit webpy websockets webtest widget widgets Win API windows Wirbel work wrapper wsgi wxPython wxWidgets wysiwyg xapian xml xmonad xmpp xpath yandex youtube zip zomg zope [cdata[cbv]] [cdata[ci]] [cdata[class based views]] [cdata[continuous integration]] [cdata[django framework]] [cdata[django-sphinx]] [cdata[django]] [cdata[nginx]] [cdata[python]] [cdata[virtualenv]] [cdata[программирование]] автоматизация администрирование администрирование django админка алгоритмы архитектура атрибуты базы данных Без рубрики безопасность библиотеки блоге бот веб-разработка видео Визуализация данных вконтакте Все записи гвидо ван россум граббер графика графы декоратор декораторы дескриптор дескрипторы документация заметки игра жизнь идея интересное киев Клиентам книги конференция личное математика метаклассы модели модули монады морфология мысли невозможное новости о облачные вычисления обо мне Обработка данных оптимизация оптимизация кода Основная лента основы парсинг парсинг сайтов перевод песочница Питон поебень поиск правила кодирования программирование Проектирование производительность работа рабочее размышлизмы Разное разработка разработка приложений разработки регулярные выражения сайт событие события ссылки статьи тестирование тесты Тюмень убунтариум фигня философия формы форум Хабрахабр хакинг хостинг шаблоны шаблоны проектирования эксперимент Эксперименты юмор я пиарюсь Яндекс